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矩阵理论 作为一 种基本的数学工具，在数学学科与其他科学技术领域（如数 
值分析.优化理论.微分方程.槪率统计.系统工程等）都有广泛应用.电子计 
算机及计算技术的发展也为矩阵理论的应用开辟了更 广阈的 府最.因此.学习和 
掌掮矩阵的基本理论和方法，对于理工科本科生和研究生来说是必不可少的. 

本书论述了矩阵分析的经典方法和现代方法.包括了由于数学分析的霱饔而 
产生的线性代数中的论 《. 是解决实的和*的线性代教问 H 的靈轚方法之一，本 
书自1985年问世以来.受到越来越多的数学工作者和科技人员的好评和欢迎。时 
至今日.本书仍旧是一本十分有价值的数学著作 
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本书从数学分析的角度论述矩阵分析的经典方法和现代方法，取材新，有一定的深度. 
并给出在多元激积分、复分析、微分方稈、最优化、遇近埋论中的许多重要应用.主要内容 
包括：特征值、特征向董和相似性.酉等价和正规矩阵，标准形， Hermite 矩阵和对称矩阵， 
向董莅数和矩阵范数.特征值的估计和扰动，正定矩阵> 非负矩阵 * 

本书可作为 T 程、统计、经济学等专业的研究生教材或数学专业高年级本科生教材.也可 
以作为数学 T . 作者和科技人 M 的4考书. 

Roger A* Horn atwj Charles R» Johnson： Malrix An^lysi.sHSBN t>-52US(^2-2h 
Originally published by Ccimbridge University Press in Reprint^ with corrections 
1987* reprinted I&88, 1^0. 1991, VJ92. Um, 199A, 丨 99 心 mi 

This Chinese edition is publishfrl with the fj^rmtssfoa of the Syndicate of the Press of the 
University of Cambridge* Cambridge» EngUnd. 

(,'opyright © by r<imbridge University Pres^. 

This edition is litenyed for distribuiiort <md KaJc- in tho People's Republic of China only, 
excluding Hong Kong，Taiwan and Macao and msy nor be disStribuied and sold ^is^wh^rc. 

氺书原版由剑桥大学出版纣出版* 

本书简体字中文版由英国剑挢大学出版社衩权机械 T . 业出皈 社独家 出版.未经出版者预 
先书面许可，不得以任何方式复制或抄袭本书的任何部分 + 

此版本仅限在中屮人民共和国境内 （不包 括中阗香港、台湾、澳门地区）销售发行，未经 
授权的本书出 〖 J 将被视为违反版权法的行为. 

版权所有， 俚权 必究， 

本书法律頋问北京市展达律师搴务所 

本书版权登 记号： 图字 .• 01-2004-6505 


图书在版编目 （ CIP ) 数据 

矩阵分析 /( 美）含恩 （ Hom 、 R . A .) 等菩； 杨奇译.-北京：机械 T 业出 版社， 2005.4 
(华聿数学 淬丛） 

书名 原文 ： Analysis 
ISBN 7-Ul-U72^Q 

r 矩… r . ①合… © 杨… 矩阵分折 

中国版本 M 书馆 （ IP 数据核宇 （2( KH ) 第号 


机械 T 业出版社街 u 号邮政缩奶 mom 

责任编迟振春 

北京瑞德印刷有限公司印刷 < 新华书店北京发行所发行 

2005年4月第1版第】次印刷 

787 mmX 1092 mm 1/16， 25. 75印张 

印数： 0 0011 000册 

定价： 45* 00元 

凡购 本书.如有倒页、脱页、缺贞，由本社发行部调换 
本社购书 热线： (010)68326294 




译者序 


由著名美 M 数学家合恩 （Horn, R. A- ) 教授和约翰逊 (Johnson, C. R. ) 教授合著的 《Matrix 
Analysis》 是一本不可多得的优秀教材.它从数学分析的角度论述矩阵分析的经典结果和现代 
结果.原书逻辑清晰，结构严谨，取材广泛，内容新颖，注重应用.原书不仅重视矩阵分析的 
教学，而且重视科学研究能力的培养.在大部分章节末尾，原书对所讨论的论题都提供了有关 
的参考文献，并且独具匠心地编排了许多具有探究性和启发性的习题，引导读者提髙描述和解 
决数学问题的能力.原书自1985年问世以来，多次再版和重印，受到越来越多的数学工作者 
和科技人员的好评和欢迎.时至今日，原书仍旧是一本十分有价值的名著，对其赞美之词不绝 
于耳；多家有影响的学术刊物高度评价作者的杰出工作以及原书在大学数学教育以及科学研究 
中的重要地位. 


1988年，译者将原书译成中文介绍给我国读者.受当时条件的限制，译者忍痛割舍了原 
书部分内容、供进一步阅读的参考文献和参考书目以及部分 习题； 而且译本印数较少，未能满 
足广大读者的需要.所幸的是，机械工亚出版社顺应了读者的要求，决定重新出版该译本，借 
再版的机会，除了勘误以外，译者还将割舍的内容全部补齐，并且根据原书1987年修订本的 
1的 9 年重印版作了修正，使译本趋于完整且更具参考价值. 

关于原书的撰写意图、特色、内容概要以及使用该书的建议等可参阅前言，这里不再赘 
述. 

书 后“索 引”中的英文名词术语仍按英文字母顺序排列，再附加中文注释，其页码仍指原书 
页码，以便读者査阅有关的内容. 

由于译者水平有限，不当之处在所难免，恳请读者惠予指正. 


译者 

2004年11月 



线性代数和矩阵理论很久以来就 G 经是各数学学科的基本 T - 具，而且就其本身的研究来说 
它们也是富有创造性的领域.在本书中，给出了矩阵分析的经典结果和现代结果，这些结果巳 
被证明对应用数学是重要的.本书可作为大学本科生或研究生的教材，也可以作为各种不同读 
者的自学参考我们假定读者已学过一个学期的基础线性代数课程，并具备初步的分析知 
识.本书从讨论特征饵和特征向量开始，所以不要求读者已熟悉这些概念. 

除了在基础线性代数教程中会涉及到有关矩阵的内容以外，实际上，任何涉及数学的领域 
(包括微分方程.概率统计， 最优化 > 理论经济学及应用经济学、工程学或运筹学等等） 都需要 
矩阵的知识.然而，直到最近，很多必需的内容才零星地(或者根本没有）出现在大学本科牛或 
研究生的课程中.随着应用数学越来越重要，有相当多的课程专门研究高等矩阵理论，这就迫 
切需要有一本能广泛选择各种论题的教材，并且它还能对有关的论题提供现代参考资料. 

虽然有不少深受读者喜爱的矩阵理论方而的经典 著作， 彳曰它们既不适合于一般的课堂教 
学 | 也不适合于系统的自学.某些传统的参考书缺乏习题、不注重应用和启发 诱异； 索引不完 
善; 处理方法陈旧.而较现代的书乂往往趋向十作为基础教材，或趋 向丁作 为讨论专门化论题 
的专著.我们的目标是撰写一本能对范围广泛的各种论题进行有效而现代处理的书. 

矩阵分析的一个意图是，它要包括由于数学分析 C 例如.多元微积分、复变量、微分方程、 
最优化和逼近理 论等〉 的需要而产生的线性代数中的论题.矩阵分析的另一个意图是，它是解 
决实的和复的线性代数问题的一种方法，这种方法果断地采用诸如极限、连续和幂级数这些来 
自分析的概念，这些概念有时比纯代数方法更为有效或更为自然.矩阵分析的这两个出发点影 
响了对本书中所述论题的选择和讨论.我们认为采用术语矩阵分析比线性代数更能准确地反映 
该领域的广泛内容和研究方法. 

为了复习和便于査阅，本书第0章介绍了基础线性代数所必需的内容，另外还包括一些有 
用的资料.第1 章、 第2章和第3章^及大部分核心内容，这贱内容可能包括在线性代数或矩 
阵理论的任何选修课程中，主 要有： 特征值、特征向量和相似性；酉相似、 SchurS 角化及其 
推论，正规矩阵；标准形和包括 Jordan 标准形在内的各种分解、 LU 分解、 QJ ? 分解和友矩阵. 
除此以外，以下各章大体上都是独立展开的，而且以一定的深度讨论一个主要论题： 

Hermite 矩阵和复对称矩阵(第4章）.该章着重讨论了关于研究 Hermite 矩阵的特征值的 
变分法，其中包括优化概念的引人. 

向量范教和矩阵范数(第5章).它们对于数值线性代数算法的误差分析，对于研究矩阵幂 
级数和迭代过程是必不可少的.该章较详细地讨论了范数的代数性质、几何性质和分析性质， 
并且仔细地区分了与矩阵范数的次乘性公理有关的和无关的矩阵范数结果. 

特狂值的估计和扰动（第6章).这是针对一般矩阵（不一定是 Hemiite 矩阵)来讨论的，并 
且对于许多应用是很重要的.该章详细讨论了 Gersgorin 区域理论以及它的某些现代的改进， 
同时还给出了有关的图论概念. 




正定矩阵 (第 7 章).该章详细地考察了正定矩阵及其包括不等式在内的各种应用，讨论了 
极分解和奇异值分解，同时还讨论了对矩阵逋近问题的应用. 

非负矩阵 （第 S 章).它们起因于其中必然会出现非负選：的许多应用（如概率论、经济学和 
工程技术等），其弓 I 人瞩目的理论反映了这些应用.在运用范数的基础上，该章初步讨论了关 
于非负矩阵、正矩阵、素矩阵和不可约矩阵的理论 • 

在本书的姊妹篇中，将讨论其他一些同样值得注意的论题：值域及推广；惯性、稳定矩 
阵、 M - 矩阵和相关特殊类；矩阵方程' Kronecker 乘积和 Hadamard 乘积；可以把函数和矩阵 
联系起来的各种方法. 

本书为一个学期或两个学期的课程提供了基本教材.根据特殊课程的谣要，教师可对本书 
的内容进行合理的选择.一般应当包括第1章-第2章和第 3 章的大部分内容以及第4章和第 
5聿中有关 Hermite 矩阵和范数的内容. 

本书大多数章1?包括了一些比较专门化的或非传统的材料.例如，第2章不仅包括一个矩 
阵的酉三角化的 Schur 基本定理，而且还讨论了矩阵族的同时三角化.在关于酉等价一节中， 
在介绍通常的内容之后，还讨论了两个矩阵是两等价的迹条件.第4章中关于复对称矩阵的讨 
论是对照推导 Hermite 矩阵的经典理论给出的.一个论题的基本观点出现在毎一章的前几节 
中，而更为详细的讨论则出现在各节的末尾或以后各节中.这样做的优点是可以依次提出各种 
论题，从而提高了本书作为参考书的使用价值，并为教师提供了广泛的选择余地‘ 

本书的许多结果(或者经推广后)适合于其他域上的矩阵，或者可以在一些更广泛的代数系 
统中讨论这些结果.不过，我们有意将定义域限制在实数域或复数域，这样就能够使用经典分 
析的熟悉方法以及正规的代数方法. 

虽然我们一般考虑复矩阵，但大多数例子只限于实矩阵，并且不 S 要较深的复分析知识 - 
熟悉复数的算术对于理解矩阵分析是必不可少的，其熟悉程度需达到附录中所规定的水平.其 
余几个简短的附录包括几个次要的而义必需的论题，例如， Weierstrass 定理和凸性. 

在本书中，给出了许多练习和习题，为进一步理解主要论题及其推论奠定了基础.练习作 
为每节的论述部分而出现，它扪一般都很基本，直接用于加深对概念的理解，建议读者充分选 
做这些练习.习题安排在每节的末尾(没有特定的顺序），其中涉及一系列难题和典型题（既有 
证明题，也有计算题），可以用来扩展论题，提出特殊见解，或者为主耍论题提供另外的证明. 
书中对较难的习题给出了重要的提示，有些习题的结果与其他习题或正文中的结果有关.要特 
别强调的是，’尽心竭力去完成练习和钻研习题对学习本书是至关重要的 • 

虽然本书不是一本有关应用方面的书，但为了激发学习兴趣，在毎一章的开始都介绍几个 
应用来引人本章的论题. 

如果想査阅某个论题的其他处理方式以及与之有关的资料，可参看“参考文献”所列著作. 
在正文中用一个简明的助记 B 引用其中的著作 I 例如， Jones 和 Smith 的著作记作 [ JSm ]. 这 
些助记码和全部引文在“参考文軚”中按作者姓名的字母顺序排列 • 

“参考文献”并不详尽.在一本有多个一般论题的书中，限于 篇幅， 在正文中我们尽可能压 
缩所引用文献的数在大多数章节的末尾，我们列出了经过挑选的文献（例如明显用到了的 



那些文献），另外附带一个简短的讨论，但没有刻意去收集有关经典结果的历史资料.众多的 
文献是由我们已参考的较专业的书籍中提供的.读者还应当了解涉及矩阵分析内容的概括性现 
代文献资料，例如 ， KWIC Index for Numerical Linear [ CaLe ] 以及 Mathematical 

办⑽⑽ 的 15 节和 65 节. 

感谢为本书提 供夸益 建议的同車和学生，他们对本书的课堂笔记和手槁提出了修改意见. 
他 们是 ： Wayne Barrett , Leroy Beasley , Bryan Cain , David Carbon t Dipa Choudhury , 
Risana Chowdhury , Yoo Pyo Hong，Dmitry Krass , Dale Olesky , Stephen Pierce , Leiba 
Rodman，Pauline van den Driessche . 


R , A . H . 
C . R . J . 



符号表 


R 

IT 

C 

c 

F 

r 

AC “ F ) 

M„ 

A , B , C , 等等 


实数域 

实 n 维列向量空间， M aJ (R) 

复数域 

复 n 维列向量空间， 

一个域(通常指 R 或 C) 

(域 F 上)分量取自 F 的 n 维列向量空间， M„,,(F) 
元素取自 F 的 ntXr; 矩阵 的棄合 
复矩阵的集合， M m .„(C) 

复矩阵的集合， M,.„(C) 

矩阵； A = [ a JeM„.„(F) 


工， y，z、 等等 列向量； j = [^]eF" 

I M n (F) 中的单位矩阵 


0 零纯量，零向量或零矩阵 

A A€M m .,(C) 的各元素取复共轭的矩阵 

A r AfAC,(F) 的转置 


A* 


A "' 

A 1J2 



adj A 
•3 


AeM„.,(C) 的 Hermite 伴随， 

非奇异矩阵 AGMJF 1 ) 的逆 
半正定矩阵的唯一半正定平方根 
AeM„, ，的各元素取绝对值的矩阵 
的 Moore-Penrose 广义逆 
的经典伴随(转置伴随） 

向量空间的一个基 

(通常指) F" 中第/个标准基向董 


W, 向量《的淡坐标表示 

线性变换 r 的呀-馮基表示 


(D 


二项式系数， / j ! / \_k\ U —々）！] 


Pa(D 

k(A) 
det A 
® 

r(A) 


A6JW„(F) 的特征多项式 

非奇异矩阵 Aew„ (关于逆相应于给定的矩阵 范数） 的条件数 
A&JW„(F) 的行列式 
直和 

A£M„(F) 的有向图 
向量范数 IH 的对偶范数 






r ㈠ 

a 

a(A)} 


n\ 

G ( A ) 
GL(«, F) 
A » B 

7( A ) 

M(A) 


J k U) 

® 


IL 


SMIL 


r(A) 


per A 
rank A 


准范数 /(•) 的对.偶范数 
(通常指) AeM„ 的特征值 

的特征值的集合（谱）；如果 A 是 Hermite 矩阵，逋常指心 

…众 

阶乘， l)(n —2) …2 ■ 1 

AeM, 的 Gersgorin 区域 

M„(F> 中的非奇异矩阵构成的群 

A , 的 Hackmard 乘积 

素矩阵 AeM„ 的本原指标 

A£M_(F) 的指标矩阵 

具有特征值 A 的（阶 Jordan 块 

Kronecker (张量）乘积 

A6M B (F) 的极小多项式 

C" 的 A (和) 范数； JVf„ 上的：，矩阵范数 

C" 的 / 2 (Euclid) 范数； JW, 上的/：> (Frobenius) 矩阵范数 

C" 上的 L (极大） 范数； M„ 上的 L 向量范数 

C" 上的八范数 

如„上的极大列和矩阵范数 

M n 上的谱矩阵范数 

M„ 的极大行和矩阵范数 

(通常指) A6M, 的数值半径 

正交补 

A€M„(F) 的积和式 
A6M_(F) 的秩 


sgn 排列的正负号函数 

UCA)} 的奇异值的集合；通常取 

A6M„,„ 的最大奇异值 ， \lAl 
Span S 向量空间的子集 S 的张成 

p ( A ) A£M„ 的谱半径 

A6M„ 的谱(特征值的集合） 

八(《， 辦 由指标集 a (9 确定的的子矩阵 

trA AeiW „( F ) 的迹 
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0.0 导引 

本孝的 r 的是简要地编撰许多有用概念或结果 • 不加证明，其中汴多概念和结果直接或间 
接地为涉及本书主要葶节的内容奠定「基础.所编写内容的大部分可能以某种形式包括在线性 
代数的基础教程中，另外，还选编/一些有用的资料.这些资料往往不易在其他地方找到，或 
者不宜安排在以后的章节中.这样，在开姶学.习本 k 之前，这一章吋作为读者的复4提要，必 
要时也为读者参阅有关资料提供方便.本章还规定/一些基本符兮，并给出一些定义；为此， 
r 解本章是有益的.这頃.要求读者已经熟悉线性代数的基本槪念和矩阵的基本运算，如矩阵 
的乘法和加法. 

0.1 向量空间 

在本书的论述屮，虽然一般是荠蓄地述及向蛍空0 [是. 向 fi 空间是矩阵理论的基本 
结构. 

化 1.1 纯置域 构成问量空间的基础是域，或 t 是具有乘法的纯#集.对于实际应用来说.在 
通常的加法和乘法运算下，基域几乎总是实数域 K 或复数域 C (见附录 A ). 但 1. 它也可能是 
有理数域，也可能是关于一个特定素数的整数 N 余类域或一挫其他的域.当未指明是哪种域 
时，就用符号 F 表示域.为了验 证-个 纯量集是域，它必须在两个指定的二兀运算(“加法”和 
“乘法”)下封闭；两个运算必须满足结合律和交换律， K 在该集合中各有-•个单 位元； 对于所 
有的元素，在该集合中必须有关于加法运算的逆元素，并 R 对于除加法单位元 （0) 以外的所冇 
元素，在玫 f l 合中有关 7' 乘法运算的逆 元素； 同时，乘法运算对加法运算必须满足分配律. 

0.1.2 向最空间域 F I •.的 向 f 空间是一 ft 对象（称为向 tt ) 的集合 V . 它在一个：元运算（加 
法）下封闭，这个运算是结合的和交换的，在集合 V 屮有-个单位元 （“ U ”）， H 有加法逆元. 
该集合对用纯量域 F 的元柰左乘向鼋的运算也是封闭的，且有件质：对所有的 a , b^F , 以及 
所有的，， V 6 V , 有 c;(x + , y ) fu 4 b)j — ax \~bj-, aib.r) 以及对乘法申-位 

对丁•给定的域 F ， 分 M 取自 F 的"元组的集合 r (» 是整数），在通常的运算（在 F " 屮按分 
量相加）下构成 F 上的一个向 fl 空间.特别地， K " 和 C " 是本书的基本向量空间.具有实系数 
或賀系数的（不超过某-指定次数的或仟意次数的 ） 多项式集合，以及区间幻 CIR 丄的实值 
或复值连续函数.成仟意函数的集合也是 （K 1.或 C 上）向量空间的闽子.韦然，在有限维空间 
K 与山 [ 0 , 1] 上的实值连续函数组成的无限维向 M 空间之 M , 有着本质的差别. 

0.1.3 子空间和张成 向量空间 v 的子空间 [/ 是 v 的非空 r - 集.它自身正好是同一个纯量域 
L 的向 M 窄间.例如 [〜 /u oT r ： «. 06 R 是 R :; 的子空间-通常，我们用某种关系来定义甸 
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t 空间的子空间. 如此得 到的由V中部分 儿素组 戍的集合关于V屮的加法是封闭的一-例 
如. w 中最•个分 M 是 () 的所有元素组成的集合.一般认为，把所得到的集合看成一个 -f- 
空间比自身宥成■个向 M 空问更冇用.弁:任何情况 F， 两个子空间的交还是子空间 . 

如采 S 是向 M 空的 I 1 集， S 的张成足集合 SpanS = >: w . n + [w 1…1 ( i ^ V )： : a , , 
… r . . t ;” …. '^ e . S , ^- l . 2, -1. 件 .U . 即使 S 不 ft F 空间 ， SpatiS 总是 
- f ^ N . 如果 Span - S = V , 就称 S 张成向量空间 K 

0-1.4 线性相关和线性无关 称一个向 ffl 空问中的向景绀彳 . ri , x _>, …，心_、线性相关，指的是 
在纯景基域 F 中存在不全为 0 的系数 《 ; ，化 ，…， 使得 

I r + a : j ~r -■* — dk-Xk = 0 

或等价地，某一向最 r , 是 筠余向 的线性组合.其中系数取自 F . 例如， （ U . 2. 3] 1 . [1. 
0, - Li 1 . ：2, 2, 2^是圯的中线性相关组， V 中的-个子集在 F f : 不线性 相关， 就说它战 
性 无关. 例如， {[1. 2, 3^ . [1. 0. — I 」， 1是 R ' : 中的线件允关组. S 要的是要注意这两个 
概念实质上 1 _ i 向量组有关.线性尤兌的仟一 （ f : 窄孓集线性无关；！0:是线件相关组；因 Ifil . 包 
舍 U 向 M 的仟 集 合线性相关.可能…个向 fi 集线性相 X ， IW 它的任一真子集是线性无关的. 

(t. 1. S 基设 S 是向 W 空间 v 的广集■如果 v 的彳’4.个元素 n 〖以表 j 成 s 的诸元素（具有纯 M 基 
域中的系数）的线性组合，就称 .s 张成 k 例如， ；Li, 0. o] T ， ！_()，丨 . [0, 0，1」' 

L1， 0， 1]M 在 H 上张成 RU 或在 C I . 张成 C). 张成向暈空间V的一个线性 x 关组为V的 
-•个某 m 然+是唯一的， m 是雇很有用， v 的毎个元柰能 a 只能用一种方式由基来表示， 
a 在该某中再添加仟何一个兀素或从该基屮 i 掉任一 元素，上述性质不再成立. v 中的无关钥 
是 v 的…个基. 3「I仅当没冇真包含它的无 关组. 张成 v 的-个集合是 v 的一个基，当且仅 
当它没存真子集仍张成 v. 毎个向量空 w 总有-•个 甚. 

o . i .< s 扩充成 一个基 向景空间 v 中的仃 何线性无关组都可以扩充为 v 的-个基，也就是说， 
给定V中的线性无关组 U,,、r ■…， ni. 存在另外的向景 xn ，…， . r ,,， … ev， 使得 u,, 
…}是7的_-个基，把一个巳知的无关织扩充为一个基，$然不是 唯一的 [例如， 
可以把第三个分量是非零的任一向量添加到尤关组 kl , 0. 0」 1 ，[0，1, 0]， i 中，便得到 R 3 
的一个基].由10, 1] 上实值连续函数组成的实向培空间 C [[), I ]的例子说明， 一 般地，一个 
基未必 有限； 由申-项式 {1. 』_, /，/，…}组成的无限集是（10, 1] 屮的无关组. 

0.1. 7 维数如果向景空间 V 的某个难包含有限个元素，那么所冇的基冇相同的元素个数，并 
a 称这个公共的数为向量空 N 的维数.这时，就说 v 是有限维的，否则，就说 v 是无限维的. 
无限维的情形（例如， c [ o , n 〉 ， 在任意两个基的元素之间存在.个一一对应，实向量空间 K " 
有维数向 M 空间 C 1 在域 C 上有维数„,但在域 R 上有维数21有时称基 { fl , 匕丨 

为 R " 或 C 的杯准荘■其中^■，的第个分《足 - 1，其余分量是 0. 

0.1.8 同构如果 f ■/和 V 7 屋同-.个纯量域 f 卜的向0}宇间， F ). /； 是可逆函数，便得对 

所有的 r ， ：和听冇的 “■ A&F 有/ x(u 二 fi /_( r ) ; A /( iV ). 则 /. 是-■.个同构，1〗_称 L / 

和 V 同构 （ “结构相 M ” M . 个域 f •.的两个饤限维向 E 卒 N 同构，仅韦它们有相同的维 
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数：1•屋，域 F t 的仟一"维向馱空间同构子 r. 因此， ff -一。维实叫 鼠空间同构十 K' 1 ， 而 
任- «维复向 M 空 W N 构于 c - 特別是，如果 v 是域 F 丨.的 fi 维 向昆空 N ，具有一个给定的 
那么，因为仟 一元袭 可以唯一地写成， 一 tf|J| 卜…十 n,, u ,eF. 
，一 1. 2, 于是， 相对于这个基，可以把 5 对应丁 '» 允组[.7'],=[〜， ....r. 对于任 
-个某 t 映射 fi v 与 r 之问的-个同构， 

0.2 矩阵 

这®所研究的对象可以用两种 S 要的力'式来考察 ； …是把它看成纯晕的矩形阵列，一是给 
毎个空间指定一个基.然 M 把它 ft 作两个向 tt 夺闯之间的线性变换. 

0. 2 .1矩形阵列一个矩阵是由域 F 中若干个纯量组成的-个阵列.如果，就称 
矩阵足方阼- F _h 的所有 //iX” 的矩阵集合用 JWi/F) 来衣示， ifijMJF) 简记为 M,,(F). 最常 
见的情形是 F=C (复数域）.述把 M„(C) 简 W 为 ,_W„. M_. (C:) 简记为 M, 通常用大写字母来 
表示矩阵.例如， 如果 



- 】 TT 4_； 

那么 /K- M」. ； （R) ■ —个给圮矩阵的于矩阵是位于该矩阵的一些指定的行和列的矩形阵列.例 
如， k， 彳]迅上述 A 的子矩阵 （抟十 第2行.第2列.第列）. 

0- 2.2 线性变换设 U 和V分别是同一个 纯旱域 F h 的”维向 M 空间和川维向最空问：设冬 
和 A. 分别是 U 和V的填.我们 "j_ 以分別用同构 -r—rr' 和 _v— 把 t! 和V中的向最表小_ 
成[上的》儿绍和 m 元 m. •个线件变换是-个函数了： u^v, 使得对丁仟意纯量山和 U2 . 
以及闷 M.ii 和.都冇 ’nAA )-«-'/'( r, >+ u , T ( j ,). -. 个矩阵可以用 

下述方式对 A;/: 于一个线忭变换 -r: u -* v ; 向讀^^当且仅与卜」,^.,^'.这吋就称 
矩阵肩小'线件变换7'(乂 于基斗 和 ) ；丧疋矩阵.4与基的选择有关，在 i<J 论矩阵时，要 
意 1K 到是在讨论关丁_特別选定的基下的线件交换， f_fl 借讪十什么苺，.般不必明 ,Y. 

0.2.3 与一个已知矩阵或线性交换相关联的向董空间不太一般性，使 F 上的 " 维向景空间与 
r 相刈应.丁_是，就把 A6M,,,.,,(F) 看作从 F" 到 F™ 的线性 变换（同时也看作一个 阵列） .这样 
一个线性变換的定义域是 F% 它的值域是！ . v t F__-' : _v — A.r ， 对所冇』 6 F ; ; . /I 的零空间是 
].re K : /l.r_-0；. /!的值域是 F" 的子空间， Ifij /\的芩空问是 r 的子空间.又丁_这 W 个7 ■-空 
间的关系 式是： 

« = /1的零空问的维数十 A 的值域的维数. 

U. 2.4 矩阵运算矩阵加法定义为两个同维阵列按对应元相加，并且用十 （“A t 表示.它 
別应线性变换的加法（关于 ffl 冋的茌 H. 继求丫从纯请域来的交换性和结合性.零矩阵（所有 
元全为0的矩阵）是矩阵加法的串.位元，并 H. 自身也是 F I■.的向量空间.按通常方式 

定义的矩阵乘法用 AB 来表示，它与线性交换的复合相对应 . 这样， M 有当 A6M_(F)，De 
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[TJ 时.它才有 定义； 它起结 合的. 一般足不交换的.例如， 

「1 0-j r l 21 「1 2」「1 (T 

Lo 2 JL 3 4J^" -3 4 」 L 。 2 」. 

但虽，当把矩阵限制在 M „ ( F ) 的某些有研究价值的子集时.它可以是交换的.矩阵乘法有一个 
单位冗 . 即形如 

「1 0 " 

! I 


I 0 1 J 

的矩阵 KhMJF ). 这个矩阵以及它的所有纯量倍数 （ 称为纯 ft 矩阵）与 M ,,( F ) 中的所有其他矩 
阵都可交换，并且只有纯量矩阵具有这 -- 性质.矩阵乘法对于矩阵加法是分配的. 

这里需要指出，我们总是用符号 U 表 / K 以下各种术语：零纯 M 、 零向暈（所有分 fi 都等于 
枣纯 S 的向景）和零矩阵（所有的元都等 T 孓纯量）..-般地， h / 卜文将明确它是哪种情形，因 
而+会引起混淆.我们还用符表示任意阶数的申位矩阵.如果可能引起混靖，就指明其 
阶数. 

«* 2. 5转.置与 Hermite 伴随如*，\ =[义 ]6 M ( F ), A 的转置 . ill 作 .足 M „.„ ( F ) 屮的 
•-个矩阵. 它的元是心 ： 即将原矩阵行与列调换，反之亦然.例如， 

,1 41 

L 4 '「） 6- 

1.3 6 

< A . 的 Ht ‘ rmiic ： 伴鲔 A * 定义力 A * = A r . 其屮 A 表 /了< 按分量取共 



转置和 Hermite 伴随[以及将在 （0- m 屮讨论的矩阵的逆]都服从倒序律： [ AB ]" = fi ' A ' 和 
[ A ^ T ^ B ' A 7 '. 当然要假定乘积有定义.对于乘积的共轭，不存在倒序 ： AB = ,\ B . 如果 j ., 
y ^ M , 那么 y . r 是纯量，并且它的 Hemuu ' 伴随与它的复共轭相同； 因此. ( y * .rV - 
3’ T = . r " y = y \ r . 

..6： 1 Hfi 矩阵乘法的技巧这里.给出 儿个耍 反复用到的矩阵乘法的简申性质. 

1- 如果~表小•矩阵乃的第列.那么乘积 AB 的第_?列 iH 好是,如,. 

2. 如果〜表示矩阵 A 的第/行.那么乘积 AB 的第/行正好是 iB. 

解释一下，在乘积 AS 中.左乘以 A 是乘 JS 的列，而右乘以 B 是乘4的行.对其中 - 个 
㈥子是对角矩阵的情形，在 (0.9.]) 中再讨论. 

3. 如果 i^rer， 那么七是（以 r 的坐标为系数的 ) a 的各列的线性组含. 
如果 agm _( f ). n ver . 那么 / a 是 （ 以 3 的毕 标为系数的) a 的各行的线忏组合. 


显然， （,VP = 
轭.例如. 



行列式 


只用一个数概括一种多变量现象.这在数学中常常很 有用. 其中 彳：列 式就是-例.行列式 
只对方阵 AeM „( F ) 冇定义，并 R 它可以按两种重要的，完全不 N 的等价方忒来描述.我们把 
的行列式记作心 t/V 

0. 3. 1 Uplace 展开对 A =「《 JK ( F ) 的行列式可归纳定义如下.假设行列式在 ( F ) 
上已定义 . H A „ eM „ ,( F ) 表 tk 从 At M „( FMi 划去第 ，•行 和第 j 列^7得到的子矩阵.于是. 
对所有的， ' < h ， . i^n - 

(― l) ,,J £j„det A„ 二 2( LV J a, : di-t A„ . 

.■- I .1 

tffi 这 t 相 N 的值就是 ,1. 等乂左边是依第,行关于渚子式的 Uplare 展 开式. 咁右边是依第 
) 列的 Laplace 展开式[见( ( ). 7. 1)]. 对于任意选择的行栉列，其中任一展开式都得到 A 的行列 
式.归纳过程从 1 X 1 矩阵升始，定义它的行列式为单个元的倌.于足- 


等等.显然，如果 AeM „( C ). 则 del / V '二 dct A ， f |. del A ' = ckTA . 
n ，3.2 交错和受上述低维例子的 妇发. 还有 
det A = U^gn a\\a„ 

其中.求和取遍1， 2 .…-的所有"！个排列 tr , 排列 a 的“正负号 ”或“ 正负号函数 ，， sg n ( 7 是 
I 1 fit -1. 取决于由 <1, 2，…，" ； 开始到得到排列所需对换（或两两交换 ] 的最小数是偶数 
还是竒数. 于是. 每个乘积 

都在行列式屮出现，如果是偶排列，则在乘积前冠以纟.号，如果是奇排列，就冠以…号. 

如果系数 Sg n tr 用某®其他的函数来代替，那么所谓的广义矩阵函数就取代 r fl Pt v \ .一 
个例子是 per A , 称为 A 的枳和式 （ pt ' rmanent )， 其中 .、 gn ff 被恒等于1的函数所代替. 

化 3. 3 初等变换 有一: 种简黾的基本变换，人们常常可以利用这些变换把任.个矩阵化简成与 
该矩阵相抵的、唯一简单的形式（即标准形），以便用它来解线性方程组.计算行 列式， 矩阵求 
逆和研究矩阵的秩，等等‘我们集中讨论关丁行的变换，它们是如下_(种变换. 

第 一种： 交换矩阵的两行 

交换第 E 行和第行可以经左乘以矩阵 
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i 列 ./ 列 

来实现，其中，在：， j 位置和 J ( 位置 上的两个非对角元是 1. 而所有未注明的元都是 0. 
第二种：用一个非零纯量乘某一行 
用一个纯 Mr 乘 A 的第;行诃以 经左乘以矩阵 




;列 

来实规 . 其中纯 Mr 出现在，.：位置. 

第 三种； 把某一行的纯量倍数加到另一行 
用 r 乘第；行加到第 j 行相当十把 <4左乘以矩阵 


r (:……士 v 行 

/列 

其中纯量（出现在 i 位置. 注意，上述每个作初等变换的矩阵，止好是把相应的初等变换施 
十黾位矩阵/的结粜 . 

第一种初等变换在行列式上的作用是将行列式乘以一 1;第二种变换的作用是将它乘以纯璜 
第 ：种变 换不改变行列式.由此可知，如果一个矩阵有-个 零行， 或有两行相关，或任意^行相 
关.那么它的行列式为零.一个矩阵的行列式是零，当吐仅当它的诸行的-个子集线性相关. 
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0,3.4 行简化梯形阵 对每个在中存在一个标准形， A 的行 M 化梯形 
(KREF). 它可以经（不唯一的） 系 列初等变换得到.许多矩阵侖相同的 KREF, 每个矩阵不 
管经一列什么样的初等变换而得到.它 R 冇•个： RRKF. RREF 的定义是： 

(a) 各 f: 零行的第一个非零元是丄： 

(b) 具有上述元 1 的列的所有其他元都 为零： 

(C) 全由零元组成的彳/出现在矩阵的 底部； 

(d) 漭首元1位 T 从左到右的“ 阶梯型’’之中，即下一行的首元1必须出现在其上一行的& 
元1的右边. 

例如， 

■0 1 - 1 0 0 2 — 

0 0 0 1 0 n: 

0 0 (； 0 1 4 

_0 0 0 0 0 0 . 

足 RREF. AeH(F) 的行列式是非零的，当且仅当它的 KREF 足黾位矩阵 

「1 0 ] 


(它的行列式是〗）.记录 F 把 A 化成 RREF 的每个初等变换对 A 的行列式的作用，可以用来 
汁算 A 的 ffi . 

考虑线性方程组 Ax ^ b , K 中 ( F ) 和托 F " 已知 ，而 . reF " 未知.对 A 和6施以 
相同的初等变换.解集合不变.解吋以从 [/ WJ 的 RKEF 看出来.事实上， RREF 是唯-的， 
并日 .两个方程组是解等价的（有相间的解集合）.当旦仅当两个增广矩阵有相同的 
RREF . 

后咱 i , 将讨论 RREF 在求矩阵的秩和逆中的作用. 

0. 3.5 乘法性质 行列式函数最关键和最重要的性质是_它是可相乘的：刈 TA , Ii 6 M „( F )， 
ciet AB = det A det B. 

用初等变换把 A 和 S 都行简化就町以证明这个等式. 

0.3,6 行列式的函数特征 把行列式分別着成神 行 （或列）的函数.时让其余各行（或列）不 
变，那么它 是孩行 (或列）各元的线性函数. 从 Upiace 展开式来看.这是很明敁的，因为一个 
给定的元的系数正好是它的丄余子式，而佘子式是固定不变的.如果一个函数依次对其各变元 
的一个给定划分中的每-组变元都是线 性的， 就称这个函数是 多重线性的. 这是相当广泛的一 
类函数.例如，函数 / U .,, r :.) = Ah 关千划分{.^丨，是多重线性的.又如，行列式作为 
矩阵的各元的函数，它对相应于各彳 /( 或列）的划分是多重线性的. 

人们自然要问，是否迄今所提到的行列式的任何一组性质都把它描述成 A 6 M „ 的/个兀 
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[ If ] 的.个纯 fl 值函数.行列式是唯-满足下列条件的阑数/: 

( a ) 多重线性的； 

( b ) 交 错的： 第一种初等变换使结果乘以 

( c ) 规范的：/(〖）一 1 . 其屮是单位矩阵. 

积和式函数(这是 M —类广义矩阵函数）也是多重线性的和规范的.但它不是交错的. 

0.4 秩 

矩阵/16从,,.„(?)的秩是-个 1 3它相 X :联的 北负 整数.记作 rank 
0. 4. 1 定义 如果 /! 6 M ([-'). 那么 ， rank A 足 A 的列向量组中极大线件无艾组的向量个 
数，这个列向量组肖然+是唯•的，佴这个集合的基数（兀素个数）是唯一的.值得注意的是， 
rank A '- rar.k A . 因此.等价地.秩可以用线性无关行来定义.这通常简述为“行秩=列秩”. 

0,4.2 秩与线性方程组 线件方程组 Aj —6(0,3. 4) 可能有0个、1个或尤限多个解，似这《只 
是可能 il :. 如果方稈组至少有一个解，我们就称它是相容的.线性方程组是相容的，当且仅当 
T ； uk \； Ah ] = rank A . 切 X 0,十1 ) 矩阵 [ Af >] 称为增广矩阵.并且，说增广矩阵与系数矩阵 A 有 
相同的秩就是说 A 是4的各列的线性组合.这时，把 f ■添加到_4的列中不会增加秩.线性方 
程绀 A.r = fc 的-个解是 这样… 个向量 . r ，使得6是以其分 fi 为系数的， A 的各列的线性组合. 
0.4.3 JiKtF 和秩 初等变换不改变矩阵 的秩. 因而， A 的秩勻 A 的 RREF 的秩相冏.它恰好 
是 RREF 中非零行的个数.用 KKEF 计算秩受病态的影响：在中间的数值算中，舍人误差 
可能使 RRKF 的零行出现非零元. W 而影响秩的识別. 

0- 4. 4秩 的特征 以 F 关于某个矩阵 At - M ( F ) 的科个命题都是相互等价的；每个命题可能 
J 2] 4:不同的」下文中用到. 

( a ) rank A~k : 

a 有々行 组成的 •个线性无关组 ， 而多 r -々行就线性 相关； 
u -) AT \ k 列组成的一个线性无关组，血多丁 4列就线性相丈； 

( d ) A 有一个其行列式不为零的6 X * 子矩阵. ft ! A 的所有 （/H 1 )X 4+1) 子矩阵的行列 
式为0; 

(=-) A 的值域的维数是石： 

a ) 有 a 个 m 又不多于+个线性无关向 fif 组成的集合， 使线件 方程组 a ,_= a 是相 容的； 
( g > k ^ niA 的零空间的维数）. 

0,4.5 关于秩的不等式 涉及秩的不等式有以 F 儿个. 

( a ) 对于 M „.„ ( F ) ， rankA ^ minfm , »;}. 

( b ) 从-个矩阵中划去若十行和（或）列后，所得到子矩阵的秩不大于原矩阵的秩. 

( c ) 如果 AGM ,“（ F ) ，那么 （: rank A + rank B )— AB < min{rank A , 
rank B ). 

( d ) 如果 A , 那么 rank rank A + rank B . 稍微复杂•，点的是 
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Frohynius 的一个不等式 . 

( e ) 如果 AeMdCF )， C ； e / W ,.„( F ), 那么 

rank AB + rank fit - ^ rank B + rank ABC . 
由此可推出另-拽不等式 . 


0. 4.6 关于秩的等式 

(a) 如果 A e (C ) ，那么 rank A - = rank A 2 = rank A;rank A. 

(b) 如果 AGM„(F ) 和 C:€M, ⑻是非奇异的 ， Be M , 那么 rank AB = ra nk B = 
rank BC=r an k ABC; 即左乘或右乘以一个非奇异矩阵，其秩不变 . 

(c) 如果 A, BeM, 那么 ， rank A = rank B, 当且仅当存在非奇异矩阵 ； f 6 M,„ (F) 
和 V6H,(F), 使得召 = 兄 4 匕 

(d) 如果 ,那么 rank <4'A = rank A, 

U.) 如果 AeM(F) 有秩 K 那么 


A = XBY, 

其中和 B £； M *( F ) 是非竒 异的.特别地，秩为1的矩阵 a 总可以写 
成形式 A=.ry , 其中 _ r 6 F ' jGF" 是某两个向量. 

0.5 非奇异性 

如果一个线性变换或矩阵只对输人0才产生输出0,就称它是非奇异的.否则就称它是奇 
异的.如果 /\eM„.,,(F)， 且 /wd 则 A— 定是奇异的.设 AeM ( F), 如果存在矩阵 H 
称为 A 的逆）使得就称 A 是可逆的.等价地，如果线性变换 A 是1 1的， 
U 它的逆变换（它也是线性变换）存在，就称 A 是可逆的.如果 A€M „, 且 = 刚 
AA '=i； 只要 A 1 存在，它就是唯一的. 

可用多种不同的方法来判别是否非舒异，这是很有用的.如杲以 
T 各命题等价： 

(a) A 是非竒异的； 

(h) A 1 存在； 

(c) rank A — ni 

( d> A 的各行 线性无 关， 

(e) A 的各列线性 无关； 

(f) del A^Oj 

Cg) A 的值域的维数为 ^ 

(h) A 的零空间的维数为 0; 

(i) 对每个 ter, a ■: r=6 是相 容的； 

(j) 如果 = 是相容的，那么解是唯一的； 

(k> 对每个 Aer, 是唯 一解； 

(1) A-7- = 0 的唯一解是 1 = 0; 


■ 
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: A 的特征值（见第1 章〉. 

I 非奇异矩阵构成一个群.称为一般线性群.常记作 F ). 


把 r 的元累看作列向量[郎 F " — M , ,」（!*’)].于是，如果. ACT . 则，和，, 
如果. t & R % 则 


V.r 是 j 和 _ v & C u 的内枳（纯量积）.常常把它记作 （ r , 还可 I 

、内枳的各种内积，所以又把这个内积叫做向最空间 C " t 的普通内积或标准 I 
... )对第一个变元是线性的 （< Qf.r 十 / ir .. ， >■> = Q \. i , . 3'- < )'>对所有(: 

eC " 成立 h 时对第一个变儿是共辄线性的 （ b . ^ > - 

\ a, C 和, y , . CT 成；） . 


两个向 Ml .)’ e ： c :" 称为正交，是指、 V , H 在二雄和 - -:维情形，通常 J 
;垂直，如釆 向量组 （ A , ^，…， A ' CC " 中毎两个向量都止交，就称它为_! 
'土交向景 m 中没有一个是零向量，那么它一定线性无关. 


Schwarz 不等式如果 . i . tC " 1 , 非 负纯量〈./， j .〉 ！ _> 是 .r 的 Enclid 长度. Kndid j 
4做正规化向量（成单位向 f ). 对丁■任意一个非零向七 C ", i ：：. r , . r }' 

:;向量.基本的 Cauchy-Schwarz 不等式是说， 

I 17 • J' 5 ' ''工 d ' 、 y ， y >' ’ 

c ' 成立； W 中等号才成立 . ，且 仅当和 j 线性相艾，推厂正交概念，两个 三 
C " 之间的夹角可明确地由公式 


cost ? — 


_ ( U I 
U: Uy ， y>' 


0<6 ^f 


hmid t 标准正交化-个线性无关向量组（它组成它的张成空间的一 个基） ! 
■个标准正交（两两正交的，各自止规化的）基来代替，卉观 上宥， 这可能 魁合1 
¥代原则上可以 ffl 无穷多种方式来实现，坷是.在进行这种替代时.有..种作 
f 效的算法，称之为 Grm - Schmidt (标准正交化）过程，设 .n ,… . 〜是一 
、线性无 Jt 向 M 的集合 . U , ，…， A 1是要确定的 iF .规化向母的正交组.可以 { 
设 . a in * 并取 


，― y.. 

= A 、、. 使得 . v : 与 & 正交，然后取 
, — - V ? 


i 的.设 



使得％与 


Xi ― (Xt ,■?(_] )«i-. 


继续做下去，直到得到所要求的标准正交向…，〜.注意，利用上述方法.一个无限的 
标准 TF 交组能够由尤限维向量空间中的一个无限可数线性尤关组得到. 

在 Gram - Schmidt 过程的每一步中，标准正交向量〜，…， A 仅仅是原无关向量： n ，…， 

- u 的线性组合（反之亦然).如果 k ! Z — … C 和 X = [〜 m ] 分别为以向量&和^：，为 
列的矩阵，那么 Z = Xi ?， 其中，矩阵尺二[%]是非奇异上 一:角 矩阵；即，当时， rj =0. 

遒后，我们指出， G ram - Schmidt 过程 ri ] ■以应用 r 任一有限的或 nl 数的向 量汴列（小一定是 
线性无关的）.如果该集合不线性无关，那么，对于使{.^，…， . rj 为线性相关组的最小6值， 

将得到向量为 = 0. 这时， a 是 a , …， l ，的线性组合.用 .〜， 代替: r t , 并继续 Gram - 
Srhmidt 过程便可回答这样一个 问题： 什么是 U , ，…， A 丨的 张成空 间的基或维数？ 

0- 6 5 标准 正交基 d 个标准正交向量组就是这样的正交向量组，它的第 …个向 景都是正规化 
的‘这个向量组不可能包含向量0,并且一定线件无关.一个标准 IK 交基是由标准 IH 交向最钼成 
的基.因为任个基可（经 （; ram - Schmidt ) 化成标准正交基，所以，任一有限维复向量空间有-个 
标准正交基.因为在计算内积时.交叉项都变为零.所以与这样的基打交道是很合意的. 

0.6.6 正交补 给定任意子集 SCC ", S 的 正交补 是集合 

5 1 = {j 亡 C ; jr'_y = 0,对所有 y 6 S }. | l _6 j 

即使 S + 是子空 间. S 1 也总是子空间.我们冇 （ Si )_ [ = S P； m S , 并迁，当 S 是子空间时， 

( S -)」 二 S '. 这时 ， dim + dim(S = n . 在关于线性方程组 Aj . = /;的叙述中（其中 A 6 
M ). 应注怠的是， A 的值域正好是 A ' 的零空间的 _ Lt : 交补，即 A.r = 6 有解（不必唯 .）， 丐 
ti 仅当 />' : = 0对所有使 A ' F 0 的 4 C ™ 成立. 

0.7 分块矩阵 

类似于集合的划分，一个矩阵的分块是把诙矩阵完全地分成一些€不相交的子矩阵.使得 
原矩阵的毎一个兀落到 R 只落到一个分块子矩阵中.为识别一些有用的结构，矩阵分块往往是 
■■个方便的方法. 

0.7.1 子矩阵 设 A € M _, (10,对于指标集 a G { l ， …， m } 和丨1,…， n } ，把 A 中位于 
标号 a 的诸行和标号为的诸列的（子)矩阵记作 AU . (?). 例如 



如果 m = = 了 •矩阵 A ( a ， 0 > 称为 A 的主子 矩阵.简记为 A ( a ), 说明•个子矩阵或一 

个主了矩阵是经划去那些行或列得来的，常常要比说它们包括那些行或列要方便些.这可以通 




]2 


第 0 章 


过补充指标集来完成.例如， A( a \ 是划去标号为 a 的诸行与标号为的诸列 G 的结果. 

矩阵 A 的 f 方阵的行列式称为 A 的一个 予式. 如果子矩阵是个主子矩阵，那么其子式 
称为主 子式. 那些出现在 Laplace 展开式 (0.3. 1) 中 的带正负号的 F 式 [(—A,,] 称为 A 
的 代数余子式. 约定，空主子式是 h 即 detAM) — 1. 


0. 7.2 分块与乘法 如果，…，&组成 （I, …，的一个划分， 而择 ，…，於绀成{〗，…， 
d 的-个划分，那么诸矩阵 AU , ft ), l < y <. v , 构成 A £ M „,.„( F ) 的一个分块.如 

果 A 6 JW „.,,( F ) 和已经分块.且使{1，…， n ) 的两个划分重合，那么就说这两个矩 
阵分块是共形的.这时， 

s 

QT ] [ AB ] U ， y ,)= ^,AU, 

k 1 

其中 AU, 译）和 B (庳， A) 是 A 和 B 的共形分块.等式左边是，乘积 AS 的一个子矩阵（按通 
常方式计算），而右边的每一个被加项是一个标准的矩阵乘积.因此，共形的分块矩阵的乘法 
与通常的矩阵乘法相仿.当各被加项有相同的分块时.分块矩阵的加法也是有意义的. 


0.7.3 分块矩阵的逆求出非奇异分块矩阵 A 的逆的相应子块，即用相应的分块形式给出分 
块矩阵的逆，有时很有用.可以采用各种不同的，但彼此等价的方式来求分块矩阵的逆一一假 
定/ \6MJF) 的某残子矩阵及 1 也是非奇异的.为简单起见，设 A 是如下的分块 


「Au A 叫 
La ；, a 2 , j 


其中， A„eM„ (F), i = l, 2 B «, f« 2 =n. 关于 A— 1 的相应分块形式有一个有用的表示式 
["[A,, — AmA 2 ^. A 21 A,/A 1L) [A；[ A7 i 1 Ai ； — A：,；] 1 "| 

L [^4 2] An ' A ,, — A 2 ；]" 1 ^si ^ n 1 " A-j, A ]I A ]2 ] _l 」 

其中，假定所有有关的逆存在.或者，用一般的指标集记号，可以 id 
A" 1 Ca) = [ACtr) — A(a->tt )A(a y 'ACa’-a)] -1 ， 


以及 


A、-</) = AC a )-'A(t r , a ， )[/U a , , u )A( tt ) l A(a,a ， ) 

仍假定有关的逆存在.还可以写出其余的表示式.注意， A-Va) 是 A '的子矩阵，而 AU) 


是 A 的一个子矩阵的逆，并且这两个矩阵一般不相冋. 


QIJ 


II - 7 . 4 小秩修正矩阵的逆 如果已知某个矩阵的逆.了解该矩阵再加 h —个“小”秩矩阵时，芄 
逆如何变化，这冋样是一个有意义的问题.有这样的简便公式，只要修正矩阵的形式足够简 
单 t 就可以使新逆的汁算比从头开始汁算要简便.设非奇异矩阵 A G At ( F ) 的逆 A — □知， 
考虑 

B = A 4 XRY , 

其中，矩阵，而 Ji Mr X , 非奇异矩阵.如果£1是非奇异的，那么 
B 1 = A " 1 - A +YA ' XJ -' YA 1 . 

如果 r 比”小得多，那么求 i ? 和 ir '+ rA 的逆可能要比求 B 的逆更为容易，并 R ， 如果 



13 


复习及其他 

A 是容易求逆的， H 有使乘法简化的形式.那么，采用这个公式可能要胜过 s 接求 K 的逆. 
例如，如哚修正矩阵有秩 i . XIhXI 的， y 是 IX » 的，且尺=[11,上述公式就变成 

货， 

(汴 意，此时 xy = s — A ). 特别地，如果 

B = ! !- 巧 ) ' 

对于 y er . / eM „( F ) 成立，那么，只要 — i , 就有 



0.8 行列式(续） 

关十行列式的一些补充材料和忸等式对丁某些论题的阐述很有用.其中人部分内容在基础 
线性代数中不易找到. 

0.8 .】复合矩阵 设矩阵 A6M(F), 艽某个阶数的所耵子式组成的阵列称为的复合矩 
阵.特别地，它的心 i ? 元为 det Af a ， 扪的矩阵叫做八的第 A 次复合矩阵，记作 

G ( A ). 这里，―, ml ■和，….都是基数为 6‘ mitvim，W 的指标集，按通 
常的辞典式次序排列.即彳1. 2, 4} ■排在 U ， 2, &之前， {], 2, 5；■排在{〗，3, 4!■之前.等 
等.例如，如果 



如米 il . i { e / V / t .„( F ). 耶么 

C', ■■- C, ( H), r ntm \m .k,n'<. 

另外.还打 


r,(/A) - I e f. 

i e m„. 则 r„(/) = i ^ m ( 
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若 A e 是非奇异的，则 G ( A )- 1 = C t (A '). 
若 At M „.„( F )， 则 C,(AM = C t ( A ) J '. 

若 则 G(.V ) = C ： t ( A )*. 


0.8.2 经典伴随和逆 如果 /\ eM ,,( F )， 由诸代数余子式 

b v = (- l ) I + J det .4 C ! j } M i r > 

组成的转置矩阵 B =[/ A _ JeM ( F ) 称为/\的（经典）伴随，常 Id 作 arljA . 有时坩转置伴隨来代 
替伴随，以免与 Hermhe 伴随 A ’ 相混淆.注意， 


其中 


adj A = EC ,^( A ) r E '- : 

0 


0 


士 . 


用 Laplace 展开式计算行列式的公式说明. 

(adj A)A = A(adj A ) = (clet A ) l . 
riOJ 因而，如果 A 是非奇异的 （ detA 孝 0>, 那么 


A" 1 = 


det A 


adj A . 


一般说来，用伴随来数值计算矩阵的逆不是可取的方法，似是伴随对干给出逆的解析表达式是 
有用的. 


0原书给出的这个关系式是错误的〔但书中尚未用到这个关系式 h ad〗 a 与 r w l (A) 应是如卜 关系： 
adj A = ；,C ,U>7- U 为 偶数） 

adj A 二 hC ” JA) 「厂二 M' ,(A) 7 ./, ( n 为竒数). 

其中 《 阶方阵^和久分 别为： 


- 1- 


_ _ r 

0 -1 

1 

T i 

1 

1 

! 

0 

' ；1 ~ 

1 

L, 」 


-T1 」 


详见 巾文： 杜忠复复合矩阵与伴随矩阵的关系及应用， T 科数肀. 199^). G , 156- J . J 8. -译音许 
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0. 8 . 3 Cramer 法则当非酐异时， Cramer 法则是求线性方程组 Ax=b 唯一解的一种 
方法.它和逆的伴随及示有相同的计算手续，一般， n 有在需要解析地给出解向景的个别解析分 
1时，这种方法才有用.如果 J •，是解向最 . r 6 F 的第/个分呈，那么， Oamer 法则可述为公式 
det (/\ - b) 

. lefi —• 

idl — 表； j ;- M „ 屮第；列是 i >, Jt _ 余各列 4 A 的对应列相问的矩阵. Cramer 法则町直接由行 
列式的乘法性质推出.把方稈组 A 」 =6改写成 

， A (I *- r ) = A ^ b , 

然后两边取行列式(利 ffl 乘法性质 > 町得 

(del A)(leL ( J 十 -lI.) = (Id {A — h.h 
iR del (J—』_)— 心，因 [W 公艾得证- 

0. 8,4逆的子式推广非奇异矩阵的逆的伴随公式，有如 K 重要 公式： 
det A - (-1) ( ； H ,a ) - 

它把 A '的渚子式与 A 6 M ,.( F ) 的渚子式联系起来. 对丁主 子阵.这个公式有简单的形忒 
dctA de -|^. 


0.8.5 Schm ■补和行列式公式刈于给定的矩阵 Ae _ M „( F ), 设 aEU , …，是使 A («) 非竒异 
的指标集.记 .4(0) 的逆为 Ak )' 用^和/对兌作 2 X 2 分块，据此，关于 det A 的 a 要公式是「21 
del A — dor / KaOdetEAti /) — A ( a ’ ts ) ACa ) L A ( a ， t /)]. 

汴意.这个公式椎 J ' r ( CL 3, l ) 中的关于 2 X 2 矩阵行列式的普通公式.称特殊矩阵 
A(a) — A(i/ ， a)A(a) 1 A(a*a^ 


为 A 的 Sdii ■科，将 


' A n 

■ A -^\ 


A l2 


J 右乘以 L 




然后把 . Uu .4( a ) 等同起来，就可验 ii 卜: dctA 和 Schur 补公式成立.注意， Schur 补已作 A - 1 的 
分块中 ilj 现过[见 ((>.7. 3)」. 


«. 8 . 6 Sylvester 恒等式 设 1 ^丨1，…，4是固定的指标集，设 6 = [\] 6 :於„ 4 (^)由 
6„ == ciet A (« U { i)-a U ：；}) 

所定义.其中的基数，， ，，』6 U , ■■+. M 是不包含在 a 巾的指标 . AGM „( F ). 另■个 
冇用的行列式怛等式是 

del H - [(Jet * 1 det A 


0.8.7 Cauchy-Binet 公式这个冇用的公式是可以想起来的，这是闪为它看上去与矩阵的乘法公 

式相类似.它等价丁 复合矩 阵的乘法性质（阽0.8.1〕，所以这不是偶然的 巧合. 设 

Be iW *,,,( F ) 和 r = A / i . 再设 U .；；; r < min { w , K t ;} , e C ；{ 1, . m } 和 …， "} 都足基 
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数为 r 的指标集.关于 r 的 a , 卢子式的表示式是 

det CXa ， p.) = 2 ^ et 犬 （0，y)dH fi(Y ， jT> t 
其中和式取遍基数为 r 的所有指标集 7 en， … ， 

o.8.s 子式间的关系已知给定基数为左的罔定指标集 a Gil, …， m ) ，当 
w g{i， …， W 取遍棊数为 * 的有序指标集时，诺子式 
del A ( cr ’ m ) 

不是代数无又的. W 为在各 T 矩阵中诸子式多 f 诺子矩阵中的各不相同的元.在这些子式当 
cm 中‘二次关系是知道的-设 a ， <_?，…. •••, w 是々个互异的指标，不.定取自然顺 
序，乂设 

^(cr；/! t … ） 

表示这样1个矩阵，它的各行用 ti ■标号 • 而它的第 j 列是. A （1 .…， "：） 的 ^ 列.这与前 

述记号的差別是，列可以不按自然«序，如在4, 2) 中，它的第丨列有 A 中的1， 
1兀和 3. 4元.于是有关系式 


det A(w 丨，■*../、 )det A ( a ;>] ■…， jP 

「 AUa ， … ，必 ] ，人乂， … w\ )det A(a- f j ： ， … ，入， .w. h ,j 




它对 丁每个 >=U 
成立. 


左和互异指标的所有序列 
i I ，… w.i f {]-*.. T "'和 


0.9 矩阵的特殊形式 

经常会遇到某些特殊形式的矩阵，这些矩阵具苻特殊的件质 . 为了鉍阅.其中有些矩阵值 
得在这里介绍.并给出其名称. 

0.9.1 对角矩阵如果矩阵 D = U v ]f M „ 在，时，有4=0，就称 D 为对角矩阵.平常， 
把这个矩阵记作 D^diagd ,…，七,= 丄 K 中 d 是 D 的对角几绀成的向量.如 
果.个对角矩阵的所有对角元都是止(非负）实数，就称它为止（非负）对角矩阵. 注意. 术语正 
对角矩阵指的是，矩阵是对角形的. a 冇正对 角元； 它不是指那种所有对角元碰巧都是正数的 
一般 矩阵.单位矩阵是 it •:对角矩阵的-•个例 f . 如果对角矩阵 u 的诸对角元都相等，就称 D 
为纯量 矩阵； 即对坫有 0=(^. ■个矩阵左乘或右乘以 -个纯 fl 矩阵，与用相应的纯量 
乘这个矩阵的作用相同. 

'个对角矩阵的行 列式正 好显它的诸对角兀之乘积： det 二 | ft /,,. 闲而，.个对角矩 

阵是非奇昇的’当且仅3它的所有对角元是非岑的. A 6/ W ,, 左乘以对角阵 D ， 即 D .4, 就是用 
D 的诸对角冗乘 .4 的各行 ( /\的第，行乘以义 . 而右乘以认即八 0 ，就是 
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用 D 的诸对角元乘/ I 的各列.因此.所有对角矩阵关于乘法相互交换，并且，•个对角矩阵 「| f ] 
与某个矩阵可交换，当且仅当在 D 的第：个对角元与第 ； 个对角元不相同时， 

有\=0.两个对角矩阵的乘积也是对角矩阵1其对角元正好是它们相应的对角元的两两乘 
积.类似地，可以规定一个对角矩阵的 iF 整数幂. 

0.9.2 分块对角矩阵 具有形式 

凡 1 0 "] 

A = ~ I 
0〜」 

的矩阵称为分块对角 矩阵， 其中， e m „ , ; _= i , 2，…， m 自 n 形式上， 

这个矩阵常常用 A = y \ n ㊉㊉ … ©/ U 来击示，或简记作 ㊉ ， 称这个矩阵为 A u , 

A ,,， 的直和.从分块矩阵的乘法来考虑.分块对角矩阵的许多性质推广了对角矩阵的 

k t 

性质，例如， dcT (㊉2八,）= n d etA 6 ,因而， A= ㊉;2九是非奇拜的，当 ft 仅当毎 个九是 

i - I } \ 

t k 

非奇异的， ； =1， 2. k . 另外，直和/\=©2人与5=©^>„可交换，其中 A „, 坎是问 

1 c — 1 

阶的. 当仅当 A D 与 氏 可交换，—1，2，…，夂还有， rank (@ U /^ 卜 y rank Ap 

!= I I ] 

0.9.3 三角矩阵 如果矩 阵7=[々]6^, 当 /<; 时， 有就称 7' 为上三角矩阵 .如果 
当 '时，^=0, 就称 T 是严格上角矩阵，类 似地， T 称为 下三角 （或 严格下三角）矩阵 ，是 
指它的转置是上 H 角（或严格上二角）矩阵.与对角矩阵类似， 二 .角矩阵的行列式是它的诸对角 
元之乘积.三角矩阵（两种中的任一种）不--定与兄一种一:角矩阵 nf 交换. AGM ,, 左乘以下 
角矩阵/.，即 H 就是用 L 的第1行至第；行的线性组合代替 A 的第；行.在述及-:角矩阵 
时，有时采用术语右(代替上)和左(代替下 〕 -角矩阵.-:解矩阵的秩至少是(也可能大 T ) 主对 
角线 h 非零元的个数. UI ] 

«. 9. 4分块三角矩阵 具有形状 

r . A i( * 1 


的矩阵 AtM „ 称为分块上三角矩阵.其屮，，丄1,…. k ， Y ^ n , ' 二 n , 而“ * ”表示仟 

' 1-- [ 

意块九.分块下三角矩阵.严格分块下三角矩阵和严樁分块上 i 角矩阵都可以类似地定义.分 
块7角矩阵的行列式是诸对角子块的行列式之积.分块-:角矩阵的秩至少是 （ 也町能人于 ） 诸对 
角子块的秩之和. 
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0. 9.5 置换矩阵 如果矩阵 PeAt 在它的每一行和每一列正好有一个元等于1，而其余所有的 
元都是 0, 就称 f 为置换矩阵. 乘以这样一个矩阵的效果是使被乘矩阵的行或列互换.例如 


是置换矩阵.而 



是向 M 2 i 的行（分最）的互换，即它把第-项换到第2个位置.把第2项换到第1个位置，而 

_3」 


让第 3项保持在第3个位置. - 般地，矩阵.，左乘以置换矩阵/^蚊,就是互换 A 的行， 
Ifij 矩阵 4 6似,„.„右乘以置换矩阵户€：«,,就是互换 A 的列.实施 (》. 3. 3>的第一种初等变换的矩 


阵是一个特殊形式的置换矩阵，称之为对换矩阵. 

置换矩阵的行列式是 ±! L 在 (0.3. 2) 的公式中 IH 好有-个被加项非零]，因而置换矩阵一定 
是非竒异的.虽然 S 換矩阵关于乘法一般是不交换的，但两个置换矩阵的乘积坯是一个置换矩 
阵. 因为笋位矩 哼是一 个置换矩阵，并且对每个置换 P , 冇= 所以，置换矩阵构成 
A 1 中的非奇异矩阵群 GLU . C ) 的 个 子群，它具有有限基数 《!. 事实上.仟一置换矩阵是 
一些对换矩阵的乘积. 

因为，如果置换矩阵 PGM „ 以某种方式$换行.则 pi—P >就以同一方式互换列，所以， 
变换 A — 以相同的方式互换 A € M „ 的行和列，这个变换相当 于里排 诸元的足码.如果 
矩阵 A & M „ 冇某个置换矩阵 JM 吏得 PAr 』 是二角 矩阵，就称 A 为本性三角矩阵.这些矩阵与 
三角矩阵有许多共同之处. 


0.9.6 轮换矩阵 具冇形状 


A = 


^1 


^2 


1 … A … a tt a, J 

的矩阵称为轮换矩阵-每行花好是前一行循环一步，使得每一行各元刚好是前一行的各元的 
一个循孙排列.置换矩阵 
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你为基本轮换转置矩阵.矩阵 ACM 。 可以写成形式 

当 n . 仅当 a 是轮换矩阵. Jim r j -/=[；%而系数« 2 ，…， a 正好是 a 的第 1 行的诸元. 
w 为 这个表 达忒，轮换矩阵具有弓 （; 相又联 的优芜结构.又因为所以两个轮换矩阵的 
乘积 还是- 个轮换矩阵.另外，轮换矩阵在乘法下交换.轮换矩阵有几种推广，例如其中之 - [iri 
把各行向前 (或 向右)循环一个大于1的固定步数. 

fl .9.7 Toeplitz 矩阵 具冇形状 


A - 


的矩阵 A = k , jGM , lU 称为 Toeplitz 矩阵.对于某个给定的序列“ , 

o„e.c, .畋项 (;1 ,=〜，.沿着平行于主对角线的诸对角线从上到下， a 的 
各元取常值. TwpHtz 矩阵 

'0 I 0 ' [() 0 

... !l •' 

1 I 

0 oj I 0 i o_ 

称为％?向位移”矩阵和“前向位移”矩阵‘这是闲它们在标准基 丨的 诸冗卜.的 
作用而得名.矩阵 AeM Bll 可以写成形式 

A= 一 

s } •] * 

qii 仅当 A 是 T uep liu 矩阵.在涉及 V . 角矩的问题中，自然要遇到 Toplitz 矩阵. 

(1.9.8 Hankel 矩阵具有形状 




的矩阵,称为 liankel 矩阵.对于某个给定的序列 
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L ,. 沿着弓主对角线垂亢的诸对角线， A 的各元取常值.在涉及幂矩的问题中，自然 
要遇到 Hankel 矩阵. 注意，如果 


" 0 1 " 

1 

P= ... 

I 1 0. 

称之为“后向单位”（置换）矩阵 • 那么，对仟意 Toepliu 矩阵 7 % PT 是 Hankel 矩阵，而对于 
任意 H ^ mkd 矩阵是 Toeplitz 矩阵.因为，和 Hankel 矩阵是对称的，这 
表明任一 Toe P lnz 矩阵是两个对称矩阵 （ P 和 Hankd 矩阵）的乘积. 


0. 9. 9 Hessenberg 矩阵如果矩阵 A = £ M PI 对干 〆 +1有〜= 0: 

"^11 ^12 … 〜_ 

A 0 化 : 

A ^ 

: 0 '• 

-0 0 …0 a rj ,„ ] a ft , n _ 

就称 A 呈上 Hessenberg 形状，或称 A 是上 Hessenherg 矩阵.如果是上 Hessenberg 矩阵， 
就称 AGAt 为下 Hessenberg 矩阵. 

0,9.10三对角矩阵如果矩阵 A 二 L 心] 6 JK 既是上，又是下 Hewenberg 矩阵，就称之为二 
对角矩阵.即， A 是」对角矩阵 + 是指当！丨>1时， a rj =0 ; 

iff II dvi 0 

叫叱 U 2 Z 

A = .. ■ 

! j r , 

L 0 “ lUfl - i “ W*H _ 

用 n 纳法容易计算二对角矩阵的行列式.注意 
如 A ("么…-方十川 

[del A ( {] ，…、 k \、 一 叫七而.川 det / U { 1,…，是一 1}) 

k = 2 , …， n —1. 


11矩阵和 Lagrange 插值法 VandernKmde 矩阵是具冇形状 

1 J：] x\ jci - jr ! { 1_ 

1 JT 2 4 

A = • 

_1 .r 么 … x ： ] _ 


( 0 . 9 .UA) 
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的矩阵，其中， A ， …， , r „ eF ; 即,4=[\],其中 U , ，— y — 1 . f 述等式成立 

det A — (. r , - . r : ) » (0. 9, 1 L 2 ) 

w 1 

于是，一个 Vandmuonde 矩阵足 非奇#的. 当且仅当"个参数 々， …，心是互异的. 

Vamlerrnrmck 矩阵出现在插值问题中，所谓插值 H ®. 就是求系数在 F 中的、次数至多 
为"1 的多项式 p ( i ： t ，）一“， L , r H ' 1 — ti „ - t 使得 

/ ><^f'i ) — u - - 4 - j I ■+■ u 2 , z'i . a rl j x'[ ] = V,, 

pi.r.) =-- a., r u-'X'j + a„ 1 — > ， 

/ • " ，/ (0. 9. 11.3) 

/j ( 八）：： “ ，丨 cn 」 i 心心丨 …■: 〜 ix ：； J = y n * 

其屮 r 」， …， a 和，，…， 义足中 F 的已知元素.插值条件(0*9.]】.3)是关于 77 个 
来知系数1 A 』的》个方 W 的组.并且它们 f ! ■形式 Afp 其中，…， 

i ] r eF \ 厂[)| ; , 3■■” …. y , y ^¥\ 且 A 6 RCF ) 是 Vandermomie 矩阵 （0.9.11.1) ■如 
果点心 ■ . r .,, … * &各不相同.这个插值问题总有一个解 • W 为这时 A 是非夺异矩阵. 

如果点 a 是互异的*插值多项式的系数原则上可以 通过解 方程组 
CO.m W 求得. 但是，用特殊的 Ugrange 插值多项式 

1丄（，—，,） 

r I 

M，） 二- ■ ； — 1 

JJ ( J , — J ; ) 

厂 i 

表示插坑多项式尸 ( jO 通常更为冶效.每个多项式 L . U _) 为；? _1 次，且具有性质：如果 

而 = u 因此，对于满足方程组 （0.9.11.3) 的、次数不超过 n — 1的多项式 
Ptr ). 冇 Lagrange 插值公式 

p ( y ) = yiLi D 丄力厂£ ( j ) + …+ v w L w ( t ). (0, 9, 11, 4> 


0.10 基的变换 


设V是域 F 上的 n 维向暈空间，％ — …，^是V 的一个基.如果是任一 

给定的向景，因为集张成 V \ 则/有某个表示 式/二 ++*+< vt, N . 如果在同一 
个基下存在労 -个表达式 ir V 、 + 決 V.2 +… 4 -凡 V,, 那么， 

0 = . i —jt = (qi - ) v , - 1 - ( g - — ) v 2 -4 - 14 * + ( a „ —凡 ） it >. 

由基名无关町知所有 A H 给定基為，从 V 到 F 的线性映射 


其 中/一 ffl _. 


H — + a #” 


_fv 


L 19] 
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nroi 


足意义明确的，一刘一的和到I:的.纯 Mu, 称为/关十 基戽的 坐标，而列向量[I],、是 j 的 
唯-._.-.見坐标 表示. 

设 T:_ V— V是给定的线件变换. K 要知道 n 个向量7\_,， Tv 2 , Tv „ . T 对仟一 
V的作用就被确 定了；这是因 为仟一 .r6 V 冇唯-表小<… + AU,,. 且由线性性质可 
知， 7>=r( a p 1 +MUTO = ：T( £tl T； j ) + M|，T(n)=a 1 Tnh“+a„7' [ v 因此，一 il 知道 
. 就可以确定 Tx 的倌. 

办 KV . ■•■, 取；是V的另一个基，可能与 A 不同，并11假定7> 的為坐标表 
「r, _ 

L ^' J ^ = T ) — ] ，2, 

那么，刈任- -』 ev ， 存 


M '= [20,]， 




… 


= 


t,„ \ 




” Xrv 阵列 | 匕]依赖于 7' 和基％ 和 J :, 的选择，但不取决于.，，我们定义 T 的基表示为 


v 「- I ; i = [ LRL ，.. L ’ a ，U 
Uu … /J 

已经证明，对任一 . rev , 际上，为了给出 7' 的一个基表 j ， 1 〆 ^ 
的情形是最常 见的； 丨 LT ],, 称为7'的.本基表示. 

考虑单位线性变换/: V -V. 它定义为刈所有 .r， u ^,. 于是.对所有 itv， 有 
=[叫= r.rj, - j 山 [ ll 广 ..r/j,, ,,r/]j^],,. 

依次取奶，…， 叱,， 这个恒等式能计算出 ，乂 /孔 1(| 「/]6的每.列，因而证明了 


1 0 " 

■ , ~ }- 

0 1 

我们泛泛采用 N - 个记号 /表示申.位妬阵和单位线性变换. 如果 从卜上=1 
始作同样的计算，也会得出 1 


' U ]/, I 化！ — / 



因此， 矩阵, .,[/] a | 是矩阵的逆矩阵.如果记那么 s U \. 于是.形 
如 ~「f」\ 的每 个 矩阵都是可逆的.反过来每 -- 个可逆矩阵 .S 二-[^^]6财„(1^对某个基3 
有形式1「/])!.可以把看成是用 [〜]' ， ; = 1 , 2 , •••. H 定义的向量组 {.S, ，， …， sj. 
闲为 S 可逆，所以向 t 组 3 无关. 

注意到 

*sn^ -- [Oi 」 

于是.~用基為表示基况的各个元素.现在 』 ev , 经计算^ 

».乂江 2 [义]々=[7>]〜， lKTj -)]^ = 4 [/] S| 

、.几 W.r] a| ^[Tj^L/xL, 

~ 〜!_’]：(〗' [ T ]' s! [ J ]、 [夂]九 . 

依次取/二叫， X£’ ; ，… .W „ . 便得出 

, 2 m+ = fl m h 4a : . 

这个 恒等式 说明，如果用来汁算表示的基发生变化，了的基表示将如何变化.由于这个缘故， 
才称矩阵为基冰-笃的变换矩阵. 

讧…矩阵 AeJVUF) 是某个线性变换 T: v - 的-个基表¥，这是因为，如果 J 是V的 
讧一基，可以用 [7>] a 二来确定 Ti. 不难算出，对这个了， a [：r],=A. 




第 1 章特征值、特征向量和相似性 


1.0 导引 

在本章以及后面各章中，先引入该章要讨论的主要问题，并用例子说明它们是如何从理论 
上或应用中产生的. 

1.0.1 基变换和相似性 每个可逆矩阵是基变换矩阵.而每个基变换矩阵是可逆矩阵[见 
(0.10) 节].因此，如果3是向量空间V的…个给定的基，了是V的一个给定的线性变换，且 
a=,[t], 是丁的 j 基表巫，那么， 丁的所有 可能基表示的集合是 
- [T], .[/L, =戽是 V 的基） 

= {S"AS i se M„CF) 是可逆矩阵). 

这正是与给定的矩阵 A 相似 的所有矩阵的集合，因此， 相 似的，而不是恒等的诸矩阵正好是 
同一个线性变换的不同的基表/下. 

人们自然希望相似的矩阵会有许多共同的性质——至少是基于线性变换的那些固有性 
质一-这是线性代数的重要论题.-个矩阵只是某个线性变换的所有可能表示中的一个.从 
关于-个矩阵的问题左探讨关于改线性变换某些固有性质的问题，这样处理问题往往很 
见效. 

相似概念是本章的主要概念. 

1.0.2 约束极值和特征值 本章第二个主要概念是特征向虽和特征值的槪念.我们将看到，使 
Ai 是 〃的 一个倍数的非零向量在研究-般矩阵或线性变换的结构中起着重要的作用，而这 
样的向量出现在求具有一个几何约束条件的实对称二次型的极大值（或极小值）的基本问题 
中 •即： 


假定6 R"r = I ，求的极大值， 

其中 A T =AfM，（R) 是给定的.这样一个约束最优问题的传统研究引出了 Ugrauge 函数 L = 
.r 7 Ax-A^ T x. 于是， 它有一个极值的必要条件是 

0 = VL = 2(Ar -lr) = 0. 

因此，如果满足/;的向童(因而 .r 矣 0) 是; t 的一个极值点，它必定满足方程 

= 因 jfti'A.r 是 T 的倍数.这一对 A，r 称为一个特征值、特征向量偶， 

习题 


1. 解释 （L 0.2) 中的约束极值问题为什么一定有一个解.并证明每个实对称矩阵至少有一 
个实特征值. 提示： 应用 Weierstrass 定理(附录 FJ 于连续函数 /0)=/A_r. 

2-设 AeiW„(R) 是实对称矩阵 (A r = A). 证明，在/ _r = l 的条 件下， 的极大值问 
题的解是 A 的最大特征值. 




1.1 特征值-特征向量方程 

1.1. 1记号我们用 M „( F ) 表示域 F 上的 n X „ 矩阵，通常 F 取实数域 R 或复数域 C . 所时论 
的问题几乎常常是一些适合于复数矩阵的情形，这时简记作 At . 对干复数妬阵的-般 
性质不感兴趣的读者， X 论用实数代替复数来阐述什么内容，都很少在表述中，在代数中或在 
实际中做出本质 K 別.但是应注意，常常在吋论多项式的根和其他与“较大”的复数域冇 X 的灵 
活性问题时， R 与 C 之间存在着较大的差別.通常，最好把实数矩 阵看成 具有特定元的复数矩 
阵.我们知道，有《个实分量(相应地，复分量）的所有向量组成的集合（向量空间）用 R " (相应 
地 tT ) 表不，并且都把它们宥怍列向最后 ， A = L \]6 M „( F ) 的转置 （0.2. 5) 是矩阵「七]6 
记作 A 「， 而当 FGC 时， Hermite 伴随是 A 的共辄转置 [ aj , 记作 A * . 类似地，如 
果 2' er , 则/表示与^有相同分量的行向量，而当 FQC 时，，表示其分量为/的相应分 
.量取复共辗后的行向量.这里，“ ■”上加一 杠了表 示一个复纯量的复共 ■(见 附录 A ), 或者表 
小一个向量或矩阵按分 量取复 共轭. 

矩阵 AeM „ 可看作从 C " 到 C " 的线性变换（对于 C " 的某个给定的基），不过把它看作数的 
- 个阵列也是有用的. .4 的这两个概念是相互影响的，数的阵列能告诉有关线件变换的信息， 
而这正是矩阵理论的实质和应用的龙键.或许，矩阵理论中最重要的概念应该是与 A 相关联 
的， i 个数的集合 a ( A ), 这就是 .4 的特征值集合. 

1.1.2 定义 设 x 6 C \ 考虑方程 

Ar = . a- ^ 0 , (1.1.3) 

其中 A 是纯量.如果纯量 A 和非零向 M . r 恰好满足这个方程，那么 A 称为 A 的一个特征值，而 
■ r 称为 A 的属于 A 的特彺向量.注意，这两个概念不可避免地要成对出现，并且，特柾向 ft 不 
能是零向量. 

1.1.4 定义 AGM ,, 的所有特征值 A 6 C 的集合称为 .4 的谱， 记作 〆 A 的谱半径是非负 
实数 〆 AhmaxU | : AecUU . 这正是包汽 A 的所冇特征值的、岡心在复平面原点的最小 
圆盘的 f 径. 

练习 如果』 是 A 的' 属于 A 的特征句釐，证明 _ r 的任..非零纯量倍数也是特征向 毡. 
n - 不说特征值和恃征向量有无其他用场，仅从代数上看，它们也有意义，因为，根据 
(1. i .3 h 特征向鼋是这样一些向量，将它们乘以 A 后有非常简单的形式——同乘以一个纯量 
(特征值)效果一样. 

例考虑矩阵 


「7 


-4 


Je m,. 


因为 


• [: H ;]， 
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于是，冇 36^4} 及相应的特征向量同时， 56 a ( A ). 可以求得相应于特征值5的特征 


向量. 

我们知道，多项式 


pit) — a k t k + at 】叫十 …+ o! / +叫 

在矩阵 AeM„ 处取值是有明确定义的，这是因为可以自乘方阵得到一个止整数幕，并 Rfj 以 
作出同阶矩阵的线性组合，于是， 

p(A) = 十 ] A s -』 f …中 A 十 ％ f. ( 1 , 1 . 5 ) 

请注意 个 有用的事实，通过多项式的关系得到的与 A6M„ 相关的矩阵与 A 有相同的特征向 
量； 它的诸特征值与 A 的特征值有简单的关系. 

1.1.6 定理设 〆*)是给定的多项式.如果 A 是 AeM„ 的特征值，而 . r 是相应的特征向量， 
那么是 矩阵 〆 A) 的特征值， 并且了 是属于 /»a) 的特征向量. 

证明： 考虑；首先 ■ 

p{A).r = ■十 a) 1 A* _1 _r 个…十 a[Ar 十 a, ： ,jr, 

其次，反复应用特征值-特征向量方程便有= A ;l Ax = 二 AA^x =…= n 

因此， 

夕 （ A) 』 . = at^x + …卞 = (a〆 + .f- a Q )x = pa)jc. □ 

练习如果 tr(A) = { — 1， 2), A6M : , WA 2 ) 是什么？ 

练习如果 0 =出叫(义， …， 尤） 是对角矩阵 （0 . 9 . 是 什么？ 给出每 — 个特 

征值的相应的特征向量. 提示： 考虑标准基向量^ , = 2, 

1.1.7 论断矩阵 aeM„ 是奇异的，当 h . 仅当 oe«(.4). 

证明： 矩阵 /L 是奇异的，当且仅当对某个 _r 尹0， yVr = 0. 这个关系式成立，当 H. 仅当对 
某个 T 乒0, A^' = 0 • .r, 即当 乱仅当 A = 0 是特征值. □ 

习题 

1. 假定 A6M„ 是廿奇 异的，根据（1.1.7)，这等价于说 A 没有等于零的特征值.如果 
A€ff(A ), 证明如果且工尹0,给出 A '的属于厂 1 的一个特征向量. 

2. 如果 A 6 M ,, 的每一行的各分量之和（简称为行和）是1,证明 iea ( A ). 提示： 考虑 
向量 e =[ l , 1,…， 1」 T , 然后说明， A 的行和都相等，当且仅当^■是 A 的特征向量.如果 
A 是廿:奇异的，证明 A 1 的行和也是 1. 给定多项式 〆 /)，证明 〆 A ) 的行和都相等.它等 
丁_什么？ 

3. 设 A£M„(R ), 如果 A 是 A 的一个实特征值， \\ Ax ^ X ^-, 0^ j ： eC , 设 

其中 f , 7 6 R " 是 _r 的实部和虚部证明 Af = 祜和由此推出存在 A 的属于 A 的实 
特征向量^ f 和7；都是 A 的特征向 母吗？ 可能有 A 的属干一个复的非实特征值的实¥征向 
量吗？ 

1. 考虑分块对角矩阵 (0.9. 2) 
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证明 A 的特征值由 A u 的特征值和 A 22 的特征值组成. 提示： 先用 A „ 和的特征向量表示 A 
的特征向量. 

5. 设 AGM ,, 如果. V 二 A , 就称 A 为幂等矩阵， 证明幂等矩阵的每一个特征值是0或 1. 

6. 设 A 6 M ,， 如果对于某个正整数 g ， A ? -0, 就称 A 为幂零矩阵，上述最小的称为幂 
零指标.证明幂零矩阵的所有特征值都是 0. 顺便给出一个其特征值都是0的非零矩阵的 
例子. 

SU 7 .我们将看到，在集中要讨论的有限维结构中，每个复的或实的力阵都有…个复特征值. 
但是，对于一个无限维向童空间上的线性变换，就可能没有任何特征值.设 v 是由诸复数的 
形式无限序列组成的向量空间 ： 

V = Uch ，… G C，i 二 1 ， 2 ,… } ， 

并且定义 V 上的线性变换 S 为 

S(a"a : ，…） = ((Kq ❿… 

这个线性变换有时称为移位算子，验证 S 是线性变换，并证明 S 没有任何特征值.提 示：证 
明，如果一个向量是特征向量，它的所 有分量 必须相同，而这个公共值只能是 0. 因此，所给 
出的 向童必 须是零向量，它不可能是特征向量. 

8. 设矩阵如果.1=.4(见0.2.5)，就称 A 为 Hermhe 矩阵，如果 A 是 Hemihe 
的，证明 A 的所有特征值都是实数.提示：设 A 6 WA ) 是任意的，并 f 丄设 . r 是相应的特征向 
■，于是 （1. 1. 3>推出/ A_r = Aii . 但是 x = ^ Mx , 所以■是实数.因为 
是正的，所以 A =， At / Vt 也是实数. 

1.2 特征多项式 

关于 A 6 M „ 的特征值，一个自然要间到的问题是： A 有多少特征值？可以怎样来描述它 
幻的特征？ 

特征值-特征向量方程 （1. 1. 3) 可以等价地改写成 

(^1 - = 0 , 3-^=0. ( 1 , 2 , 1 ) 

因而， A 6 t 7 CA ), 当且仅当 A /— 4是奇异方阵，即 

dciUl - A ) = 0 . (1.2.2) 

1.2.3 定义 A 6 A 1 的特征多項式定义为 

pA<t> = det ("— .A) , 

把它看作 r 的形式多项式. 

注意用/作为特征多项式的形式变元.为的是把它和一般的特征值或多项式的零点 
；1 区别 开来. 在其他地方，有时用同一个符号表示它们. 

_ 1.2. 4论断如果 AeM ,,， 则特征多项式九 〆 ‘）的次数为《，并且的根的集合就是 
■ ff ( A ). 
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证明： 化 （•: I有 次数” 可以归纳地从 detOJ—A) 的 Laplace 展开式 推出： 当行列式展开时， 
//- A 的每一行仅 提供； 的一次幂.第二个论断与 （1.1. 3) 和 （L 2. 2) 等价. 口 

练习证明， det(A —") = 0 与 det(t7 —A)=0 有相同的根，并且证明， det ( A - tI ) = 
C-l)Met(r/-A). 因此，特征多项式又可以（并且有时就)定义为 det(A—"). 证明所定义的 
特征多项式保证 r 的(首项）系数总是 + 1. 

练习如果 A=[" a 证明 —+ — 虹），且 

LC d 」 

a ( A ) = + 

设 A€A^(R ), 证明，如果则 A 的特征值是实数.此外，它们是实数，当且仅当 
( a - dy + ibc ^ O , 如果不是实数，则成复共轭对出现.最后证明，如果 U — d) 2 +4 &尹 0,则 
特征值不相同. 

在某些一般的情形，矩阵的特征值是容易看出来的.最常见的是因矩阵的形状而使行列式 
容易计算的情形.其中包括对角矩阵、3角矩阵和一些其他特殊情形. 

练习证明，如果: T6M„ 是:-:角矩阵 

… C 

丁= \ ， 

0 

那么 WT) = Un， 心，…， U， 即了的诸对角元之集. 

练习设矩阵九 sm „ 的每个元都等于1: 

_i 1 … i_ 

j„ - i ■. ; . 

_i … 1 _ 

的特征值是什么？证明 0( 出现两次）和3是_/ 3 仅有的特征值.由此类推，人的特征值是什 
么？ 提示： 考虑向量^ = [1. 1，…， 1] T . 

练习确定矩阵 



的所有特征值和相应的特征向量. 提示： 利用前一个练习，并写出 A = —九. 

1.2.5 定义从 (0.7.1) 可知，的々乂4 主子矩阵 是位于有相同指标的&个 行和是 个列的 
子矩阵，而々主子式是这个主子矩阵的行列式. .4 二[心]有个不同的 6 X 4 主子式，用 

仏 （ A ) 表示这些子式的和.特别地.仏（,4) = ；|>,,称为八的迹，通常记作 tr A 或 trace A .注 
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意， E pr ( A)-det A 

练习如果 A 6 M 2 , 证明 h (/> = ^-( t r A ) f+det A - 且 [；A = t r A 和 = 

一个基本的，但并非显易的事实是，复系数《次多项式在复数范围内恰好有 〃个零 点（重 
零点按重数计算），称这个事实为 代数基本定理 （附录 C ). 由此，可得到如下®要论断. 


1-2.6 论断毎个矩阵 AeM „ 在复数范围内恰好有„个特征值(重特征值按重数计算）. 

注意 这里，当提及 A $ M „ 的一个特征值的“重教”时，就可简单地理解为 A 作为特 
征多项式 pj *) —个零点所出现的次數.更全面地讨论特征值的重数将放到 （1.4) 节， 
不过，知道多项式的各阶导数与该多项式的一个零点的重数之间有一定的关系是有用 
的.多项式/>⑴有 A 作为是>1重零点，当且仅当 〆 z ) 可 写成 〆 r ) = (;— A )~( f ) 的形 
式，其中 <?( f ) 是使 t / U ) 参0的多项式.微分这个恒等式就得到/⑴厂吣一 A )* '</(() + 

(;— 并且从这个表示式可以看出， //( A )-=0, 当且仪当 6>1. 如果走>1， 
1)((— A )"? W + 每一项含有一个因式 （/ — A )" 1 的多项式，其中 
于是， /( A ) =0,当 JL 仅当 i >2. 重复上述计算便可证明 ，X A pitm k 
[40：； 重零点，当且仅当 〆 A ) = / U ) 二…= 〆 * A p w a )^0. 

1.2.7 例命题 G .2.6) 与以下事实密切相关：复数域是代數闭域，也就是，每个系数在该域 
中的《次多项式在该域中有《个零点.对于其他域上的矩阵，例如实数域或有理数域，…般几 
乎不能说出一个矩阵在该域上有多少特征值.但是，再看一看 （ L 1) 节的习题8,它却是能说 
出特征值的某些情况的一个 例子. 在任意域的情形，一个矩阵也可能根本没有不同的特征值. 
矩阵 


L ； :] 

的所有元尽管都是实数， m 它没有实特征值，矩阵 


| , . (1.2.7 b ) 

I 

[ 0 1」 

不管它是几阶，也只有一个特殊的特征值 u 重特征值 1). 

练习验证 a 2.7) 中的论断. 

练习如果 AeM „( R ), 且《为奇数，证明 A 至少有一个实特征值. 提示： 一个实系数多 
项式的任何非实复零点，必须成共轭对出现，并且注意到，如果 AS ： M „( R )， 那么 h (*) 有实 
系数. 

根据 （1.2. 6), 可以把 AGJW , 的特征值排成 

又]，，…，又 u ， 

其屮的顺序是任意的，并且按其重数重复这些特征值.于是.因为 （1.2. 4)，我们得知 
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/?' ⑴= (f Uj — U …一 A rr ) , (L 2. 8) 

1.2.9 定义 n 个数 A ! ，…，夂， k ( n ， 的6次初等对称函数是 

k 

s〆 入"…，入己 2 JJa ： » 

它是所冇个取 U A, ，…. A„ 的不同项的 A 次乘积之和. 

例如. S s U ,， …， A ,, I ' A , -*..+ A „ 是诸 A , 的和.而 MAi ， .... A ,」） 二; lr .‘ A „ 是诸 A , 的乘 
积.因为 （L 2.8) 以及/是用某个行列式定义的.在矩阵 A 的特征值的初等对称函数 
S ,( A ,. …，；1„)44的各6:<1主子式的和£： 1 (/\)(1.2.5)之间存在某种关系，以下两个 fu : 等式 
是 W 然的，费点功大便… 验证： 

C ； -A, )-.-</ -A„) -r ~S,(A, 1 + S,(A 1 ,- ! A„)r ? 

上 - S , Oi ，…， A „)， ( l . 2. in ) 

以及 

p ,( t ) ■- r - E ,( A ) r ~' I ; —…土 a . 2. m 

练习验证 （1.2. 10) 和 （1.2. 11). 前者可以通过计算乘积 （f — LKfA „) 中 * 
的系数来直接验证.苦可用 L a [ J U _ e 展开式归纳地验证. 

综合（1.2.10)， （1. 2. 11) 和 （1.2. S ), 有卜― 面的定理. 

1.2.12 定理如果 ，…， A ,, 是 AeM „ 的特征值，那么 
.S\u, = Ki(A). 

A 的特征值的 i 次初等对称函数是 A 的各主 f 式之和.特别地 
tr A — 

和 

det A = JJa ,. 

-I 

习题 

1. 用 a 2. 12) 验证 （ Li . 7). 

2 . 对于矩阵 力£财„,,„和石6抑_[见（0.2.1)1， 通过 t 接算证明 u = BA . 再用这 
个事实证明，对和非奇异矩阵 tr S '' AS = tr /\. 矩阵 S MS 称为 A 的相似矩 
阵.上述结果说明，迹是相似不 变最. 相似性是下一节的主题，并且将会看到，所有主子式之 
# E t ( A ) 都是相似不变姑.汴意，因为乘法性质，行列式显然是相似不变 M . 

3. 如果 DfM „ 是对角矩阵，计算特征多项式/ ^( f )， 并证明如 （1)) = 0. 

1. '& AGM , r , '& ，足划去/\的第 t 行和第 a 列后所得到的 A 的主子矩 

阵，；='1, ■■■, a . 证明 




(1.2. 13) 
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5. 回忆前一节的习题 S, 证明幂零矩阵的迹为 0. 幂零矩阵的特征多项式是什么？ 

6. 如果 A 6 WA ) 是 h ⑴= 0的单重根. A € M „, 证明， rank(A 但反过来不 

一 定成立[想--想例 （ 1.2. 7b)]. 提示：利用 （ 1.2. 和？ = A 时 （ d/dd/M/)^0 推出， A-XI 
的各个 《 — 1 阶主子矩阵是非奇异的. 

7. 用 （1.2. 12) 确定矩阵 


P 1 0 0 0'| 

ll 丄丄0 0 
0 1110 
0 0 111 
0 0 0 1 I 


的特征多项式.考虑如何利用这个方法计算，般的〃 \ » =.对角矩阵 (0. 9. 1 U ) 的特征多项式. 

8. 如果 AeAf ,,，^(.4) = 1^!, ■■■. A ,/. 假定 = …， Af ,}, 证明对所有正 整数是 


ir A 1 f A ?, 

r- l 

等式心'边的和称为 A 的诸特征值的 4 次矩.由 （2. 3.1) 知，所作假设 成立. 

9 . a 接计算 s z a . s , Ui , D, s,(k,, u 和乂 a , …， 

10. 设 V 是域 F t 的向量空冋.线性变换 T : 的特征值是纯量 A 6 F , 使得有一个非 

0:1] 零向 SufV ， 适合 i £ 明，如果 F 是复数域，且 V 是冇限维的，则每个线性变换了 

有一个特征值.给出例子说明，如果其中.个假设条件（ V 的有限维性质或 F = C ) 减弱，那么 
了可能没有任何特征值. 提示： 设 J 是 V 的基，并考虑[: T ],. 

1] -设/>(;)—“，+«, ] + + 1 = 1,是给定的首系数为1的多项式，具有 

零点幻， A „( 计相重零点）.诸零点的6次矩记作屮 = A ! 十# I - …2, 
iiji 明 Newton 恒等式 

^ t +" 〆 /『■[：. I I f … h ： ■十… 4 = 0，々 J 1.2,'^ , n . (L 2. 14) 

说明为什么诸零点的前几个矩唯一地确定多项式 〆 ?）的诸系数（因而确定诸零点），反之亦然. 
提示： 证明，对某个尺>0,如果 I H >«，那么（卜 j ) ^ t - A ；/ 1 .卜 .，因而 

/ ⑴ H 2 0 -X,) "* = tit 1 -|-^1 r 2 -T/^1 J -| - , It I>R. 

证明 〆 (/)= 〆 。/^)， 据此， Newton 恒等式以及关 f 较高次矩的另一恒等式 

叫 “ H - h /irr-* ]tJ„ 1 -\~ ii, r ~ t a„ = 0, k _ 二 1,2,* •- 

可以通过比较系数推出. 

12 -设九是给定的矩阵.证明， A 和 B 的特征值相冏，当且仅当 tr A*-Mr B *， 
々 = 1. 2，提示：利用习题8和 Newton 恒等式 (1.2.14) 证明 A 和的特征多项式相同， 


1.3 相似性 


正如仵 （1.0) 节所指出的， Al „ 中的一个矩阵的相似变换对应于 c ‘ i : 的一个线性变换在另 
一个基下的表示 • W 此研究相似件可看成是研究一 个线 件变换所同有的性质或它的所有基表示 
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所共有的性质. 

1.3.1 定义设矩阵 A , BeM ,,， 如果存在非奇异矩阵使得 
B = S^AS, 

则称 B 与 .4 相似，而变换 A—S ' A . S 称为由相似矩阵 S 确定的相似变换.关系 “ B 与 A 相似” 
有时简记作 B - A . 

1.3.2 论断相似是 JW ,, 上的一个等价关系；即相似是 

( a ) 自 反的： A - A ； 

( b ) 对 称的： B 〜 .4 推出 A 〜 B : 

( c ) 传 递的： C ； 〜 B 和 B 〜 A 推出 C 〜 A . 

练习验证 （1.3. 2). 

像任何等价关系一样，相似关系把集合 M ,, 划分成互不相交的等价类.每一个等价类是 
M „ 中相似于某个矩阵（该类的代表 〗 的所有矩阵的集合.在一个等价类中的所有矩阵都相似. 
而属于两个不同类的矩阵不 相似. 由于传递性，在任何一个相似矩阵的有限序列中，第一个矩 
阵和最后一个矩阵在同一个相似等价类中，一个至关重要的结果是，任一个等价类中的矩阵共 
同具有许多重要性质.其屮一些将在这里论述，而关于相似不变量的一个较完整的描述（例如， 
Jordan 标准形 >将放在后面的第;?章. 

1.3.3 定理 设 A ， BeK . 如果 B 和 A 相似，那么 B 的特征多项式与 A 的相同. 

证明：对任意；，我们有 

pnU 、 = det (// - B ) 

= det<?S l S-S ' AS ) = det S ] ( f / - A)S 
=det S ~ ] det (；/ — A )det S ' 

=(det S ) 1 (det S)detffi — A ) 

= det(" . A ) 二 p A {th □ 

lj .4 推论如杲 Beu „ t 且4与右相似，那么它们有相间的特征值（重特征值按垂数 

计算). 

1.3. S 例有相同的特征值是相似的必要条件，但不是充分条件，考虑矩阵 



每一个都有二重特征值0,但它们不相似. 

练习 K 明与零矩阵相似的矩阵只有它本身，然后利用这一事实验证例 （1.3. 5) 中的论断， 
练习如果矩阵 A ， 相似，并是多项式，证明与 〆相似.特别地， 
'td: 明.如果 £( 是纯那么,4+((/，与 B+tJ 相似. 

练习如果 fi, r，DeM,,， 且 A 〜 K 和 C: 〜 D 是经同一相似矩阵 S 实现的， 证明 A-f 

r 〜 b+d. 

练习如果 A, S6M„, _ftS 是非奇异矩阵，证明 KdS 卜 E t (A>， 特别是， det S 1 AS 





二 dftA 和 uS l ,4 S = irA ， E |] 行列式， 迹和艽 他的 AX 6 主子式和是相似不变量. 

练习 证明秩也是相似不变 M : 如果相似于 A 6 M „, 耶么 rank A . 提 

示: 见 （0. 4. 6). 

因为对角矩阵特別简单，乂有很好的性质，因此有必要知道，对于哪些矩阵 AtM „, 在 
A 的相似等价类中#在 个 对角矩阵.即哪些矩阵相似十对角矩阵. 

1.3.6 定义 如果相阵 ASM ,, 与一个对角矩阵相似，那么就说 .4 可对角化.有时也采用术语 
可对角的. 

1,3,7 定理 设 AtAt . 那么. .4 可別角化，当且仅当 A 有《个线性无关的特征向量. 

证明： 如果 A 有；；个线性无关的特征向 ttj ' 1 ’， …，以它们为列作非奇异矩阵 S , 
通过 〖 I 算. 

S J AS - S 1 [ A ： l - ;1> Ar t -) , … 

= S ] - 

= S *S/1 二 A ， 

其中 


[0 A„J 

而 Am +‘‘， A , !是 -4 的特征值. 

反过来，倘定存在相似矩阵 S 使得 S-MS 是对角矩阵.于是 AS - SA , 这就是说 ， A 

乘 S 的第 ； 列（即 AS 的第 f 列）是 d 的第；个对 角元乘 S 的第；列（即 SA 的第；列），或者说， 
S 的第 （ 列是 A 的相位 于 Yi 的相应 T - A 的第『个对角元的特征向 W 为 S 是非奇舁的，所以 
存在》个线性无关的特征向量. 口 

更注意的是， （1.3. 7) 的证明原则上是 X 丁•对角化一个可对角矩阵的算法；求4的各特征 
值； 求相应的各个特征向景（考虑重特征值），然后把它们徘成矩阵&如果诸特征向量线性无 
关，那么 S 是一个对角化相似 矩阵. 但是，我们要着電指出，这只是粗路的分析性解释，不是 
实际的计算方法. 

附注 如果 A £ Ai , 可对角化，与 -4 相似的任一对角矩阵的各对角元必须是/ \ 的具有 
适当重數的特征值.此外，线性无关的特征向量（它们组成相似矩阵）必须对应具有适 
当重數的不同的特 征值； 即，如果』 ⑴ 是线性无关的特征向量，且户, 〆 /)= 

(/— A,) … （f A „ J , 那么，对诸指标的某个排列 r , 有 A , r ⑺.=夂⑴丄 1 

练 3 证 明矩阵 A — □ J 不能 对角化 . 

其理由是：一方面是因为，如果它可对角化，它将相似于0矩阵，而这是不可 能的； 另一 
方面，经计算.除了差一个比例因子以外，只存在.个属于0的特征向景. 

练习 如果 a 可对角化，而 #•) 是一个多项式，证明对角化. 提示： ')=- 
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S l .j(,A)S' 

练习如果 AfAl , 且 AeWA ) 作为 A 的特征值有®数证明，如果 rank ( A - A ；) > 
n 那么 A 不能对角化. 

保证 可对角化性质可行的 - 个简单情形是矩阵的各特征值互不相同.这个事实的-个重要 
前提是 F 述引理，它还有其他用途： 

I - J -8 引理假定1，…. A * 是的两两不相 H 的特征值，而/"适相应亍人的特征向 
暈， ^-1, k . 那么…，1是线件无关组. 

证明：证明实质 L 是用反证法.相反，假设 y ”， …，是一个线性相关组，那么存在 
一个等于0向 M 的非平凡线性组合.并且实际上有这样一个线性组合，它的非零系数最少.假 
定这个极小的线件相关关系式是 

+a L >.J'' ?1 I …— 0, r ^ k. 

因为所有有 r>l. 为方便起阽，可以假定它包含前 r 个向#(如果必要，吋重排编 
弓）.同时.还有另-个相关关系式 

ACff[.r ll) -f ••- -|- a,J- <r ' ) = ffi Ar l；l -1 '■- 

二山乂,/ 11 I …丄 U〆 … 0. 

现在用 l 乘第一个关系式.然后从第二个关系式中减去它便得到第〔个相关关系式 
tt [ ( A ] — A r -1 ■-…十 a r : ( A r ] — A , ). r ：r 11 = 0 , 

它的非零系数比第 '个关系式要少.因为 A ; ^ A 〃 ^-1, 2, r -1, 这最后-个关系式是非 

乎凡的.这就与第一个相乂关系式的极小性假设相矛盾，因而得证. □ 

1.3, 9 定理如果 A 6 M ,, 冇 M 个互不相 N 的特征值，那么 A 可对角化. 

证明： 如果…，弋 }, 设/。是相应于 A , 的特征向量.因为特征值都各+相 
同，根据 （1.3. 8)， U 111 , …. x 1 "'} 是线性无关组，因此，再由 （1. R .7) 可知. A 可对角化. 

练习给出一个可对角化矩阵 A 6 M „ 的例子，但它没冇相 M 的特征值. 

练习由 （0. S . S ) 想到，置换矩阵 P 是其毎一行和每一列中怡有一个分量为1的以0, 1为 
分 S 的矩阵.因而尸 1 ^^、证明 .46 M ,, 的•个置换相似重排 A 的诸对角元，然后址明，对 
仟一对角矩阵，存在一个置换相似矩阵，使其对角元 wf 按任意顺序$排，特别是任 一 亟复出现 
的对角元可相邻地排放在一起. 

矩阵 A , _ BeM „ 关于乘法.般不交换， fti _ 是，如果 A , B 都是对角矩阵，它们总是可交换 
的.谊后一个站论可以做些 推广； 在这方面， F 面的引理是有益的. 

1.3.10 引理和召&似,.,是给定的钜阵，且设 

，- rA 01 

f = Lo J 

是 A 与 B 的直和.那么， C 可对角化，当&仅当 A 和 都町对 角化. 

证明： 如果存在卄竒异矩阵& 6 M „ 和非竒#矩阵 , S 2 ，使得\ 45,和 AVflS , 都是 

对角矩阵，邱么容易验证 S _ CS 是对角矩阵，只要 S 取直和 
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S = 


[ Sl 。1 

L o 

反之，设（::可对角化，存在非奇舁矩阵使 S 1 CS = ^ = dmg ( Aj , A z 
对角矩 I 浑.如果用 


r ) 是 


e e ■%?, e c \ r ,, e c \ 


1.2,-,n- 


表 j Si [ W .. v , 那么，对!_=1，2，…， n + m , Cs , = A : j , 推出和 如 

果在集合 {&,•■•， U 屮.无关叫曾少于 n 个，则矩阵 


的列秩（因而行秩）将小十 M . 同理，如果在集合 h ,, …，7,, j 中，无关向量少于 ™ 个，则 
矩阵 


[M... 1 ?™] t M "w," 

的列秩（因而行秩）将小于 m . 在其中■•种（或两种）情形下，矩阵 


「 r?i ■■■ 芒" "j 

s = [i, …、 ., r ] = I 6 

L?i "• 

的行秩(因而秩)小于因另 S 是可逆的，所以这是不可能的.因此，在集合 W ， 匕 ，…， 
中价有》个线性无关的向童，又因为这每一个向量都是 A 的特征向量，所以 A —定可对 
角化.同理可证矩阵 b 可对角化. □ 


1.3.11 定义 我们说两个可对角化矩阵 A , BtAf ,, 同时可对角化， 指的是存在同一个相似矩 
59] 阵 . S 6 M ， 使得 S - iAS 和 .S 都是对角矩阵，即，如果存在同一个基，在这个基下，两个 
线性变换的表示都是对角矩阵. 

练习 证明，如果4， 36财„同 时可对角化.那么它们可交换. 提示： 写出 A = SOS — 1 和 
B = SES D 和 E 都是对角矩阵.然后利用对角矩阵是交换的事实计算和 SA . 这种处 
理方式 会经常用到. 

练习证明， 如果兌 6 M „ 可对角化，而;^是似„中的一个纯量矩阵，那么 A 和"同时 
町对角化. 


J . 3 . l 2 定理 设 fJ 6 M „ 可对角化.那么， A 和 B 可交换，当且仅当它们同时可对角化. 

证明： 假定 A 和 B 可交换，在4和 B 上同施以一个相似变换使 A 对角化，因而，不失一 
般性，可以假定 -4 是以角矩阵，仍不央一般性，再假定 A 的任一多重特征值相邻地出现在主 
对角线 h . N 为二 SA (上述公共的相似®换不会改变这一关 系）， 所以有 
AA ; 二 Mj ， 

其中 ， B = !>,]， 而; h ，….夂是4的各特征值.因为 ( a ,— 二0，由此可知，只要浐 
A ,， 就有\=0.因此，接上面已经给定的 A , 项的顺序， B 是分块对角矩阵： 

卜0-| 

B = I | ， a 3.13) 


0 B k 
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其屮，对于 A 的每个不同的特征偯，有一个子块 B,. 每个是一个方阵，其阶 数是号 它相应 
的 A 的特征值的里数.因为 G 可对角化，根据（〗.丄10)，每个 fi, 可对角化.设 T, 是使 
T ^ B . T , 为对角矩阵的非奇异矩阵.因为 A 有分块形式 


0 1 


A,7 


i 〔） 

其中每个纯《矩阵与认同阶.我们看到 T 


A 乂 


AT 都是对角矩阵，其中 T 是直和 


注意， 

逆命题已包括在前面一个练习中. □ 

作为本节的结束，把 (1.3. 12;推广到较大的矩阵集合，并且对不可对角化矩阵的情形给出 
一个较弱的结果. 


1.3.16 定义矩阵的•个族:; CM ,, 垦矩阵的任一 （有 限的或无 限的） 集合，而交换族是其每一 
对矩阵在乘法下都是可交换的族.我们称子空间对 A 6 M : 是 A - 不变的，是指 A w ^W 
对每个 成立； 称 W 对族，不变的，是指 W 对每个是 A - 不变的. 

注崽. 如果 AeR , C " 的-维 . V 不变 - f 空间中的每个非零元素是 A 的特征向暈. 

练习设如果 W 是维数至少为1的 C ’ 1 的 A - 不变子空间，证明在 W 中冇 A 的一 
个特征向 ft . 提示： 选取积的一个基，然后考虑作为 V 上的线性变换 T : u ,— 的 基表亦 
矩阵. 证明这个 矩阵有 一个特征值.要点是：为什么 7" 是 IV 上的线性变换？ 

一个重要的结论是下面的引押:. 

1.3 .H 引理如果 >_EM 是交换族，那么，存在 |ij 量』 ec "， 它是每个 Aei 的特征向量. 

证明：设屮 GC " 是有 最小正 维数的 $ 不变子 空问： 这样的 W 存在，但未必唯一.因为 
C ， 本身就是7不变的.所以知道冇一个 ri 维 ■'/- 不变子空间.如果存在 n — 1维不变子空间， 
那么就要问是否存在/一2维-不变子空间，等等.实际上，只要证明 W 中的毎个非零向量 
是每 t .4 e .? ■的一个特征向景，就完成了引理的证明.假如上述情形不成立，那么，对某个矩 
阵 A 63， 并非妒中每个非零向量都是 A 的特征 向量. 但是，因为评是^/―不变的，所以它是 
土不变的，因而在使得 Adr 对某个特征值 A 成立.定义 = hy = 

A /， 于是 • re - W ,， 且是一个子 空间. 因为关于 A 的假设， W ,^ V /, 因而州„的（正） 
维数严格小于 w 的 维数. 设£6乂如果则有 B & w ， 这是因为且政是 
不变的.但是另-方面，因为〒是交换族， 




38 


第丨章 


A ( a t -), 因而得出 Rrew ,:. 由此可知，见 (! 是不变的，但因为有严格低于 W 的正维数， 
这就产生/矛盾.证毕. □ 

引理 （1.3.17) 足关干任意基数的交换族的.特别是，如果？ =< A , 是 R 有两个矩阵的 

族， 那就是说，仟一对交换矩阵有一个公共的特征向量.定理 （1.3. 12) 是说，如果 A 和 B 不 
仅可交换 | fi 〗 R 每-个也都可对角化，那么它们同时可对角化.我们的下一 t 结果要证明，关于 
两个可对角化矩阵的交换放的上述性质不是它所特有的：这个结论可以推广到 H 有仟意基数 
的族- 

1*3.18 定义同时可对角化的族 JCM , 是这样 --- 个族，关于这个族.存在同一个非舒异矩阵 
seM „. 使得对每个 AC >_. S * AS 是对角矩阵. 

1.3.19 定理设是由可对角化矩阵组成的族.那么，/是交换族.当11仅当它足同时 
可对角化的族. 

证明： 如果.>-同时可对角化，那么，根据前面的练习.它是交换族.对"作0纳法来证明 
其逆命题.如果”二1，就没有什么可 I 止的了.因为每个族既是交换的，也是对角的.假设 ">2. 
并 ri 假定，对 6 — 1. 2，…， 7,-1, XT 满足假设的所有矩阵族，结论已经证明，如果少 
的每个矩阵足纯 M 姖阵.那就无须证明，因此，可以假定， .4 e j 是某个具有特征值； 

A .” …， A * (其中芊少有两个不相同，的可对角化矩阵，还假定，对每个矩阵 
AB ^ BA , fi . 每个> Mj 对 角化.采坩弓 （1. 3. 12) 中相同的沦证，可以把情况简化 
为‘ .4 实际上是对角矩阵， .4 的任.多里特征值相邻地出现， R . 特征值的顺序是冋定的，即 A 
□ S 有形式 （1.3.14). 因为每个 B 6.7 与 A 交换， a . 3 . O 中证明，每个有阶数为 ri -.〗 或小 
十《 — 1的矩阵 n : 和形式 （1. 13). 在 n . 3- is ) 中子块的阶数和位置完全由 a 的诸特征值的重 
数和顺序所确定，丙此，对于所有 Be f ， 它们都是相 n 的.内为，所有矩阵 Be >.都可交换 
〔不只是与 A )， 11每个有一个釭和形式 （_!• 1 13)’ 所以， ，.>_ 中任一矩阵的6个直和被加 
，•块中的每-个都是, y 的其他每个矩阵的相应子块可交换，并 Q . 根据 a 3.10), 这每个子块 
都可对角化.由归纳假设，存在是个相应阶数的相似矩 阵 - r , ，乃 ，…， n . 它们中的每一个 
都使 > 中的每个矩阵的对应子块对角化.正如 （ i . 1 3 . 15 ) 中的直和那样，直和 Tl ® T 2 ㊉ …①乃 
使/屮的每个矩阵对角化. □ 

附注与这一节相关的两个重要问题将推迟到第3章讨论 ： （1) 给定 A ， B 6 M ,,， 如 
何确定 A 是否与 B 相似？这是促成求相似下的标准形的动机 .（2) 不计算已知矩阵 
的特征向量，我们如何判别它是否可对角化？ 

作为交换性的最后一个附注，我们注意到，虽然 AS 与 R 4 未必是稍同的矩阵（并 | j . 即使 
网荇都夤定义，它仍未必是 N 阶的），但是从它们的特征值来看，几乎是相同的，如果 A 和 B 
都是方阵， AB 和 SA 恰有相同的特征值. 

1.3. 20定理假定 AeM ,„,„ ，, X 那么与 AB 冇相同的特征值（重特征值 

按 t 数汁算），再附加 r « 个等于0的特 征值； 即⑴二 r >灿（/).如果 m 厂〜且义或 
B 罕少有一个廿:奇异，那么相似. 
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证明： 考虑以下两个涉及 m „ h , ，中的分块矩阵的 m 等式： 

rAB oir ^ /!]_ 「仙 aba - 
L B oJLo J 」 一 L B BA . 

rAB ABA - 
L B BA . 

因为分块矩阵 

n a — 


[: X 


LO 


, J G . 

1 卜奇异(它的所有特征值是 + 1 )， 得出 

[I oir/ A] 

Lo 7」 Lb oJLo iT 

即两个 （ m 十 n ) X( m + n ) 矩阵 


"0 0 ■ 
Lb BA . 


G = °1 和 C 2 - [ 0 ° 1 

L s o 」 1 IB BA 」 


相似 . C , 的特征值是 AB 的特征值再加上《个零.的特征值是 flA 的特征值冉加上川个零. 
W 为根据 （1.3.4). C ( 与（4的特征值相同（计相重特征值），所以定理的主要论断已经证明. 
ft 启一个论断可从以下结果推出：如果 A 是非奇异的，且^ = «，那么 / Ui 〜 A ( R 4 M 


习题 


1. 如果 A，BtM,,, fiA 与 B 可交换.证明 A 和关于 S 的任一多项式可交换. 

2. it A, B6M, 且冇 WA) 二 {A,， …， A „} 和…，卢丄如果 A 和 B 可对角 
化，且可交換，证明.存在1，…， n 的某个排列使得 .4 十 B 的特征值是 

A ; +-// (| . A - 十户,：，… . A „ +&. 

3- 如果 二 S l DS, D=diag( t / [ , rf„), 且〆 O 是多项式，证明〆 A)= 

-S >(D)S 和/ >U)) 二 diag (/>(£/,)，…. p ( dj ). 只要能使 .4 对角化，这就提供了计算〆/!)的 
一个简便方法. 

4 - 给出两个交换矩阵不可同时对角化的例子.这与定理 （1. 〗3. 12) 矛盾吗？ 

5. 如果冇互不相同的特征值，且与给定的矩阵 £ieM„ 可交换，证明 R 是次数至 
多为 n — 1的关于 A 的多项式.提示：采用在定理 （1.3. 12) 的证明中使用过的方法，证明 B 和 
A —定同时可对角化.然后想到，给定互不相同的数 ai .…，〜和的，…， ft, 存在一个次数 
至多为 n - 1的 （Lagrange 插值>多项式〆 ‘） ，使得〆 《,) 二具.见 (0.9. 11). 

«■ 如果 A6JW,, 可对角化，考虑特征多项式多八;），证明 Ai 1 (A) 是零矩阵. 

7. 设矩阵 A, B6M,,, 如果"=6,就称 A 是 S 的平方根.证明中的每个可对角化 
矩阵有一个平方根. 

S. 如果 B6M,,, R 至少 有一个有互不相同的特柾值（关于另一个，甚至连它可对角化 
都没有假设），证明，/!和 B 可交换，当迁仅当它们同时可对角化. 提示： 充分性的证明是容 
显的；至 T 必 要件，试图采取如下形式的论证来作为 （1. 3.12) 所采用的方法的一个补充.假定 



B 有互不相同的特征值 ， Af ^( W ). = 及厂， 0. TB (.4^ ) = A ( Rx ) = AA . r - A /\. r , 

由此推出 Aj _ 也是 fJ 的属于 A 的特怔向 fl . W 为不可能存在两个这样的线性尤关的向鼋（因为 A 
是单重的丨，所以 A . r 必须足 .，的"倍 ： HW A .^ f ,. r . H 此. fi 的每 f •特征向量也是 A 的特征向 
量，并且使 B 对角化的这些特征向 骨所组 成的同-个矩阵也使 A 对角 ft 有关这同 -- 个命题 
的其他处理方法.见习题12和] 3. 

9. 对定理 （1.3.20; 的下述 >]一介证明作洋细的沦述. （ a ) 首先，假定/\， BeM „. 且其中 
至少有一个是非奇异的 . SF . 明 .. Ui 相似十 : 因而 AS 和 JM 的特征多项式相同 . 提示：若 

A 是非旮异.的，则仙 一 /\ : (. AiJ ) A . 此时， CT ( VAiJ ； n ( M ). ( b ) 考虑夺异矩阵 A - r 1 0_ |和 

U) 0 」 

—o 01 

证明 / U : t 与 BA 不相似， f 日它们有枏同的特征值. （ r ) 证明，若_4， B 6 M „, W AB 

与 / iA 有相同的特 征值. 包括重特征值. 提示：考虑 下面的分析论 kt . 对所有 光分小 的^>0, 
4 十 E /是非奇 异的； 因而 A j 与 fiA 5 相似，故/ U 与凡\冇相同的特征多项式.如果我 
们现在令0,取极限不能保证其相似性_何其特征多项式仍然相等.这是因为/ = 
( let (" — A , 召）连续地依赖 £ . 因此与 / S /1 有相阮的特征多项式，丙而有相同的特征值，包 
括重特征值. < ci ) 最后，若 BeM 0 „„, 证明， Afi 与 R 4 有相同的特征值，包栝重特 
征姐-仉不包括 R 4 另有的 《- m 个为0的恃征值（假定 n >, ，山等价地. p !lA ( l ) = r ' - p V ! ， M ). 
提 示：从 .4( 添加若 _P 0行）以及 执 添加若 r 0列 > 作两个新的 hX ,, 矩阵， 利用最 后一个结果， 
把两个新的(鲐过适当分块的）矩阵乘积与原有的两个乘积进行比较. 

10. 利用 (X 3. 8) 证明下述 推广： 设 .46 M ,, d 知， 且1 ，…， A ( 是义的互不相同的特奸 

值，对于每个 ; =1. 2 h 假定 〖是 A 的相应于特征值 A , 的《，為1个 
特征向童的尤关组.证明，诸集合之并 ur . ...，;是 

一个尤关组. 提示： 如果某个线性纟 n 合是零.比如 1 

0 。2 Su :. 二 S .- y, ' t 

■■ 1 J i - : T 

利用 U . 3. 8)证明每个 y '--0. 

11. 对引理 （ l . 3 . 17) 的下述另一 个更具 构造性的证明作详细论述. （a > 证明，若 A , 

可交换，则它们冇 .个 公共特征向提示：设上是.4的一个特征向量 ， Ax = ^-, J 7 i 0 . 
然后考虑序列 x，fTj , .... 这个序列中…定有一个元素与它前面的元素线性相关， 

取最靠前的这种兀素，如 B*.r ，所以 S = Span( j., Br ， B z j, ijHy 是召的一个不变子空 

间，因而存 ft 某个非零 S 使得 By =^_ v ■但是 AB j j -= B ' A.k = B'Xx = ABV ， 闽而 . S 中的每 
个非零向量也是 A 的特征向量. < b ) 若 >'= iA , ， A 2 ，…， A „) 是一个有限交换族.用归纳法 
证明，对所冇 A , 有一 个公共的特征 向扯. 提示：若），关0逛/\,，，4 2 ，…，/\,„ ，的 一个公共特 
征向： t , 像 ( a ) 中那样，考虑序 列 — v , A ：, y , Aiy , ( c ) 若是一个没有有限基 
数的交换族.注意到在 >中不可能有多于 Y 个线性无关矩阵.选一个极太无关组冉利用 a ) 证 
明，这个有限组的公共特征向量是 >-的所有元素的公共特征向量， 
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12. 如果，1，…， A „) eM „ 有《个互不相同的对角元，用定理 （1.3. 12) 的证 
明思想证明.对某个 BGR . AB ^ BA , 当且仅当 B 本身是对角矩阵(但不必具有不同的对角 
元、. 

13. 假设 A 6 M „ 个互不相 N 的特征值.如果对某个 AB = BA, 证明 S 可对 
角化，且 A 和石同时可对角化. 提示： 如果 A 二 SAS ' A 是对角矩阵，证明 

交换，然后利用习题 12. 

U . 把习题13的结果推广到交换族这个族至少包含一个具有《个互不相同的特 
征值的矩阵.试将这个结果与假定族的所有成员都是可对角化的定理 （1.3. 19) 作一比较，这是 
一个较强的结果吗？ 

15. 考虑分块对角矩阵 yl = diagU 乂， hh， 其中， I, 6 M„ ,如果；乒 j, 

则义,4\，且％+« 2 +…+叫证明，对某个 seA ^，AB = BA, 当且仅当^阵/3有分块 
对角矩阵形式 Brdiag (払.氏.…， B*), 其中， J^6M V ) = \, Z, k . 这个结果与习 
题 U 冇何关系？ ' 

16. 设 A ， Q 假定 A 或非竒异.如果 AB 可对角化，证明 fM 也 nj 对角化.考 
虑 U 和说明，如果 A 和 B 都是奇异的，上述结论未必成立. 

1.4 特征向置 


迄今为止，巳经着重讨论 f 的特征值，也时论了相应的特征向童.特征向量不仅 
在对角化中起1要作用，而且在各种应用中也有它们的用场.为此还要较深人地讨论特征向 
M- 不过先从关 T 特征值的另一个论断开始. 


J.4.1 论断 设 A6M,， 那么， （ a ) ， 7 与 A 有相同的特征值(重特征值按重数计 算). （b) 4■的 
特征值是 A 的特征值的复共轭(重特征值按重数计算）. 

证明： det(//-A r )-det(f/-A) T -=det(；J-A), 所以 = 因而 (a) 得证.类 

似地， det(^-A - ) = det[(;7-A)' ]--d"et(rJ-A), 由此推知九 .（f) =^777. 因而 （b ) 得证. □ 

练习如果 . r , y ^ C 都是 A 的相应于特征值; I 的特征向量，证明上和>,的任一非零线性 
组合也是相应于; I 的特征向 M . 由此得 H 属于某个特征值的所有特征向量连同零向 
M 组成的集合是 C " 的一个子空间. 

练习 说明在上述练习中所描述的子空间恰好是 A- 的零空间. 

1.4.2 定义 设 A&M,,. 对于给定的 A6a(-4>, 满足 A_r=A ^ ■的所有向量的集合称为 A 
的相应于特征值 A 的#征空间，注意，达个特征空间的每个非零元素是 A 的相应于 A 的一个特 
征向量. 

练习 证明， A 的相应于特征值 A 的特征空间是 A- 不变子空间，但是，反之不成立.证 
明一个极小的土不变子空间（不真包含较低维的非平凡 A- 不变子 空间） 是单独由 A 的一个特征 
向量生成的. 提示： 运用 （1.3. 17) 之前的练习. 

如果知道 A6M„ 的一个特征值，一个计算相应特征向量的方法是解线性方程组 
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(A-AJ)x - 0. 

这个方程组从理论上看是简单的，而实用上未必行之有效.这个方稈组的所有解的集合组成特 
征空 N . 

1.4.3 定义的相应于特征值2的特征空 问的维 数称为特征值 A 的几何重教. A 作为特 
征多项式 />,(*) 的零点的®数（至此，已经涉及了重数概念）称为特征值 A 的代数重数，一般说 
来，这两个概念是不同的.在述及特征值时，如果不加限制地使用术语重數，那通常指的是代 
数重数.我们将采用这个约定. 

应该指出 的是. 几何重数 iK 好是相应于某个特征值的线 性无关 特征向的最大个数. 

练习证明 . A 6 M ,, 的一个特征值的儿何虽数不大于， R _ 可能小于它的代数重数.如果 
代数重数全少是1,那么几何重数牟少是 1. 提示：假定 A 的几何5数是且设是以 
.4 的相应于 A 的线性无关特 征向童 为其前 i 个列的非奇异矩阵.采用类似于 （].: W ) 中所用过 

的证法， i 正明 S — M . S 有形式: | , H 因而得川结论， A 的代数重数至少是 L 

4.4 定义如果矩阵 AeM „ 的某个特征值的几何重数严格小于其代数重数，就称 A 是7损 
的-如果毎个特征值的几何®数都和其代数重数相同，就称 A 是非亏损的.如果 A 6 A 1 的毎 
个特 征值恰 奵有儿何重数 1( 不考虑代数 t 数 K 就称 A 是非減次的.所有这些概念都是迕典 
的，它们在某些场合被广泛采用. 

我们指出，一个非减次的、 非 7 j 损的矩阵就是一 t 艮有5不相同的特征值的矩阵. 另外， 
矩阵可对角化，当 LL 仅3 A 是非亏损的.这 R 是重述（1.3.7)，它突出 f 每个特征值 
有足够多的相应线性无災特征向量的必要性. 


1.4. S 例尽管 A 和 A 1 ' 有相同的特征值，供是它们的相应干某个特征值的特征向 M ' m 了能宂全 
I 不同.例如，设 



那么， A 的相应于特征值 2 的 （一 维） 特征空间由成， l_fH A 1 的相应 特征 空问由 

[U 生成. ° 

练习验址 （1.4. 3) 的细节. 

很明显，迄今所阐述的恃征值和征向量的理论.可以平行地对左乘以行向 M 来进行阐述. 
诸特征值将会相同，但诸特征向量 般 不同（即使考虑到行对戍于列）. 

1.4. 6 定义非零向量 . vG ( T 称为 A 6 M „ 的相应于 AGWA ) 左特征向量，是指 
= Ay * ■ 

-如果有必要明确，就称 a 1.3) 中的向量为右特征向量，当上下文不要求区别时，就只说特征向量. 
练习证明，相应于的特征值; I 的左特征向量7是/\,的相应于 j 的六 特征向鼋， 
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同时_7是#的相应于 A 的右特征向量.用例子说明，即使对于 .4&M,,(R). 左特征向坫和右特 
征向也未必相同. 

从 （0.6.2) 可知，两 t 向 Mi. jeer 称为正交， 是指， a 二 o. 下面的结果称为双正交 
原理， 

1-4.7 定理 如果 A6M„, 月 A, /.GerCA). 那么犬的相应于"的仟一左特征向董与 A 

的相应丁的任-右特征向暈正交. 

证明： 设 yGc " 是 A 的相应于"的左特怔向量，而 .rec ■是 A 的相应于 A 的 tr 特征向 M ， 
用两种方式计算， v'A.- 

v ' Ai — 3 1 ' U . r ) Kj . j ') 

— ifjty'、x = ； j(. y' j. ). 

因为 Afu， 所以 A_v'.;' = #'■/ ■的 唯一可能方式是，.；"= 0，即 _r 与 j 正交. □ 

练习 如果 /V=A6M„, 即 AM Hermite 矩阵.且 A 有互不相同的特征值，证明存在 A 
的 n 个两两 it: 交的（打)特征向量.从 （1. 1) 节习题8可知， A 的特征值都是实数， 提示： 因为 
A* - 左特征向量与右特征向 童 相同.应用 （1.4. ?). 

fr： K -草将肴到，衣上述练习的陈述中，关于力:不相同的特征值的假定是不必要的. 

K 面踅指出，特征向鼋在相似下的变换 A 式是简单的.而特征值当然在相似下不变. 

1.4.8 定理 设 A , SeM „. 如果是相应 TA 6 VB ) 的特征向景，且与 ,4 相似， 
邱么 . St 是 A 的相应于特征值 A 的特征向 fi. 

证明：如 果 B = S 'AS. R Br = Xj , 那么 SH-U, 或 ASjISV . 因为 S 非奇异， 

H. 所以& 70，因而 S.r 是 A 的特征向量， 口 

练习 验证 e=[l， 1, I] 7 M 

'I 2 3 
A - ；i 2 ! 

2 3 I_ 

的特征向量.如果 D= ( !iag(l， 2,幻，确定 iT 1 AD 的一个分量全为 TH 的特征向量. 

作为本节的最后一个结论，我们指出，可以利用特征向量得到有关主于矩阵的特征值的结 
果-这个结果为一个特征值的几何里数与代数茧数之间的不等式提供了乂一个证明. 

I. 4.9 定理 设46财，且 A&C 已知 ，乂设 是某个正整数.考虑卜列个命题 ； 

(a) A 是几何重数至少为6的 A 的特征值. 

(b) 如果 AeM,„ 昆 A 的.个主子矩阵 U 那么 A 是4的特征值. 

(C) A 是代数重数至少为6的 A 的特征值. 

那么， （a) 蕴涵 （b >, 而 ( b) 蕴涵 （ c )_ 特别是，特征值的代数重数至少等于它的儿何重数. 

证明： 假定 （ a ) 成々 :， 且设 A &/ W ,， 是_4的阶数为,/ rSn - > 的主子矩阵.因为可以运用置 
换相似和 （1. L 8)， 所以不妨假定 A 出现在 A 的左上角‘设…， ■^是 .4 的相应于特征值 a 
的线性 X 关特怔向量.把 A 和每个 v , 块分成 
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A = [: :]， A 6 M,„ ； 

- [2]' «■ e C ", 恥 € C "1 , 厂 1，2 , … .L 

因为向量切 lf …，^^是维数为 》—(» 的空间中的 A 个向量，所以它们是相关 
的：因而存在不全为零的纯童 m ， …， a ^ Vy 使得 a] 疋 I +以1^ =0. 于是 t/EcfiA +…十 

^ = [^0, 其中十…十 Qii * 尹0,且 Au = Au . 把这个等式写成分块形式便得到 


Av — 





这说明 A 是 A 的特征值.这正是 （ b ) 中的结论. 

现在假定 （ b ) 成立，并且想到恒等式 （ L 2. 13>,这个恒等式把特征多项式的导数与 
AWn 个主子矩阵 A , ，…， A „ 的特征多项式 ( f ) 联系起来.如果4 = 1,那就没有什么可证 
的.如果方>1,那么 （ b ) 是说， A 是每一个 A , 的特征值，因而，/ ( A )=0, 且 〆 , （ A )=0, 如 
果走>2,微分恒等式 （1.2. 13) 得 


心⑴ =2〆 '⑴， （ 1.4.10) 

1=1 

然后利用 （1.2.13), 用毎个 A 的诸主子矩阵的特征多项式之和代替等式右边的紐个导数.因 
为 A , 的-个主子矩阵划去丫一行和一列，所以它是 Z 的阶数为《--2的主子矩阵，把 （ b ) 中的 
假定和悒等式 U . 2. 13) 用到每个人就得到 ^( A )-0. 重复上述论证便可证明，对；= 0, 
1， +■•, A —1, 各阶导数此都为零，因时 A 的代数重数至少为 I □ 

习题 

LID 1. 证明，有秩1, 当且仅 当存在两个非零向量 a ytc ", 使得 

A — jry " 

并 R 证明： （ a ) 这个 A 至多有一个（代数重数是1的）非零特 征值； （ d ) 这个特征值是 y a 
( d r 和 > 分别是相应于这个特征值的右特征向量和左特征向量.特征值 () 的几何重数是多少？ 
3. 证明， 秩为* 的矩阵可以写成 

A = yy 11 - 十…十 i ⑴ y *' 

其中， y u '€ C \ - = 1. k , 即 A 为 A 个秩〗的矩阵之和.提示：求出6个线性无艾 
的行和列.然后利用其余的行和列可以用它们来表示的事实. 

3. 假定 TeM „. 上二角矩阵，且它的互不相同的特征值/„,..•，~沿对角线从左上角到 
右下角依次出现.证明， 存在] '的相应于；的一个右特征向量，它的最后 n '个分景都是0, 
JHL 存在 T 的相应于 ； „的一个左特征向暈.它的前，一]个分量都是 0. 如果 r „ 不是 fi : 不相同 
的，耶义会怎样呢？ 

4 . 证明，在 （ 1 . 7 ci ) 中所列出的矩阵的（仅冇)特征值】有儿何重数 i . 描述它相应的特征 
空间. 
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5. 考虑分块角矩阵 

a :=L aJ ， 

证明火的各特征值是 A ,: 的各特征值#加上 A , 2 的各特征值 （ 计相 t 特奸值）.如果 .r €； 是 
.- V 的相应十& < j ( a „ ) 的右特征向量，而 3> ec u = Mi a ;2 的相应十 " g <；( a 2；; ) 的左特征向量 ， 证 

明 Klec ' i 、 和是 a 的分别相应 _ fA 的右特征向童和相应于户的左特征向量.关 

f a 的分别相应于 A 和 y 的左特 征向# 和右特征向 M , 你能说些什么？你能把这些结果推广到 
ft 有仟意多个对角 f 块的分块=角矩阵吗？ 

6. 如果 . A € 关于一个几何重数是1的特征值有正分量的左特征向量和右特征向 tt 证 
明，除了与这些向橫左一个倍数的向》以外， A 没有其他分 ft 是非负的特征向 M . 

7. 在这个习题中，概述关于求 A & M ,, 的最大特征值及其相应的 特征向 JS 的幕法.我们作 
某些假定以简化论述， H . 使分祈部分可以更为明确.假定 A 6 A 1 有瓦不相同的特征值…， 
A „： 且恰有一个具有最大模 〆 A ) 的特征值 A „. 如果^ ec u *5 相应于 A „ 的一个左特征向量不 
正交，证明序列 

’ 1: Ar ，> ' ，卜。山 2 ,… 

43近 f A 的一个特怔向 tt , 而诸向量 与/〃 屮的某个给定分 M 的睹比值趋于； U , 提示： 
不失一般性 • 假定 = U 设^ . ++■, y "' l 相府十 Ai ，…， A , 的线件无关的特征向量.向 
#广 : 可以唯一地灰小•成 

u li; 卜… +W 

乒 0. 注意 . / —«, A ;_ v 小 卞…- aW " ， fEi 差-.个比例闽子.因为 I A」l <1. I A , 〜 0. 
卜 - i •…， n - i , 从而这个和 a 十 y " 的 -- 个倍数. 

8. 用幂法还可以计算其他的特征值（和特征向景不过耑借助桥梁，称之为压缩， 
它给出个阶数比 A C - M ,, 少 I 的方阵，其特征值是3令 F 来的特 征值. 设 A „ 和.广 1 是(用幂法 
或其他方法算出的） A 的特征值和特征向 fi ,且设 S 6 H . 是第1列为的佧奇择矩阵.采用 
习题7中的记「』_，址明 


S ' A.S - 





i；l AifM ,.: 的特征进焐，…， A „ 卜从/ \ i 可以算出另外的特 t : 倌，然后 S 复施行压缩，如 
此等等. 

9-设 AOW , ，有持 杌值 A , ，… . A ,, ! ■ 〔). W(?[f rank ,\< ； r ], 再假定 .4 的最后一行足其 
余 ft 行的线性 IU 介. （ a ) 如果把坎分成 


「'II “ | ] 

K 屮 A/At 疗 /K 向、便得 







试用 A 的相应于 0 的左 
提示： 考虑 A 的经 


的相似矩阵.应指出的 ;I 
一种形式.如果知道 A | 
其中 P 是适当的置换矩 f 
10. 是非 

間 的右特征向量. 


第〗章 

al* = //A t] a 2 z — 

值来解释 6. ( b ) 再证明 An + wZ / eMd 有特征 值1 ，…. 

[； :] 

, 因为具有余下来的特征值的低阶矩阵是可以给出的，这便是压缩的另 
一个特征值 h 那么，本习题所描述的过程可以应用于 P(A XI ) P ~\ 

卜异矩阵，它的各列是 AGH , 的左特征向量.证明（: T ) 1 的各列是 A 





第 2 章酉等价和正规矩阵 

下制，要研究一种特殊类』 fl 的相似.它跟矩阵分析的许多应用有密切关系. 

2.0 导引 

对一般的作奇异矩阵 se ， 在第一荜中初步研究了经 s 的相似问题.对十某些很特殊 
的非奇异矩阵称之为丙矩阵，它的逆冇简单的形式 ： S '= S *. A 6 A 1,, 经-个酉矩阵的相 
似 . A ► S - A . S , 不仅理论上比-般相似更简单 （ S ' 要比 S _ : 容易计算得穷），且有许審优点， 
这些优点通过以后的叙述会变得更加明 W .. 人致说来.酉相似优于一般的相似，因而，了解通 
过两相似所获得的性质是很 A 用的 .f Li 足， ft 两相似下的等价类比在一般的相似下的等价类更 
细（两个矩阵可以相似，佴不酉相似）. 囚而， 相应地所能得到的每个等价类也较小.在第3章 
中还耍进一步研究一般的相似. 

设 ASA 1, 假定 S 是非奇笄矩阵 . 但不 '定足西矩阵，那么，变换 .4— S ' AS 称为•相合， 
这将在第4章加以研究 . 这个变换也是 M , 上的一个等价 _ X ; 系. H . 冇许多（与相似不同的）特 
点.里要的是蜇意识到，通过 K 矩阵的相似既是相似，也是•相合，并乩是兼有相似性质与相 
合性 质的* 广泛的变换类. 

2. 1酉矩阵 

2. 1-1 定义我们知道，向量 . n ， …，构成-个正交组，是指对所有的向最偶有， 
. r ：. r ,= D , ⑹ < r . k . 此外. 如 果诸向 M 还是疋规化的，, = 1, k , 那么该向 
织称为标准正交组. 

练习 如果 { Vl , …， .y, 1是由非零向 M 组成的 IK 交组，证明由 .T, 二 1 ， = x- i - 
1,…，4定义的向 M 组是一个标准正交组. 

2.1.2 定理标准十:交向量组线性无災. 

证明： 假定： {.h .…， 』_*!■是标准正 交扪. 3.0—«[.;■, I …于是，因为诸向量 .r, 
是正交的.所边0 - 0- 0 = — [ | fr , I w : 乂珩 向量 a 是 m 规化的，所冇 

r.; J - I 

k i 

Sr D I & i : 1 - ()* 因此，所行 故(山，…， a . 1 是线性尤艾组. 

J - 1 r 1 

练习证明非零向 W 组成的正交 组线件 X 尖 . 

练习 证明， 如果…， 々 ec " 是正交组.那么， aMk ^ n , 或古诸向#，中至少有 
左一 „ 个等丁-零. 

3然，一个无 X 组未必 JE 正交组， 4 、 过，可以把 （^• m - Sdimich 标准正交化过稈 （0. S4) 应 
用于该尤 艾组，从而 得到-个标准正交组，它也生成原向横组. 

练习证明仟意々维实的成复的向 M ■空 N 有.个标准正交茁（.个由标准 iK 交组组成的 
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基). 

2.1.3 定义设矩阵 [ ieR , 若 U *[7=7. 就称 (7 为酉矩阵，若还有 L /6 M „( R )， 就称 [ J 是 
实正交矩阵. 

M „ 中的酉矩阵构成一个值得注意的_重要集合.在 （2. 1.4) 中列出 了义干 t 7 是两矩阵的几 
个基本等价条件. 

练习若 . 4 € M „ 是非奇异矩阵，使贴：/,证明，⑷石是唯一的， （ WA / 卜 /. 
自然， WB = vV ] . 提示： 非奇异性推出，对任意给定的方程 A.r = , V 和: rM — /有唯 
61 j -解. (逐列） ilF . 明』 ^ = J 和（逐行)证明 = / 有唯一解仏， B k e M „ , T - 是.用两种方式 
计算队 AB * 便可证明扎 

2. 1.4 定理如果 UeAl , 那么下列条件等价. • 

( a ) (7 是酉矩阵； 

( b ) l ； 是非奇异矩阵， tit ；- = u - 1 ; 

( c ) UL 7- =1； 

CJ ) 是酉 矩阵； 

( e > [ J 的各列组成一个标准正 交组； 

( f ) I -/的各行组成-个标准正交 ffl ; 

( g ) 如果， e - C " 且. ■ yEf /' r , 那么， 3 .的 Eudicl 艮度与■的相冋：即 

证明： 条件蕴涵条件 （ bh 这是因为 ， U 1 是唯 -- 的 （ R 要它存在 h 且 [ J 左乘以它就得 
If M 矩阵的定义保证就是这样的矩阵-闶为二 - I , 当 if . 仅当 An .= l ( 对于 A , HGM ,,), 
所以 （ b > 蕴涵 ( c ). 因为((7.)*=[八（…推出适合酉矩阵所必需的 条件； SH ( c ) 蕴涵 （ d ). 由 
T 上述每个推理都可类似地反推回去，所以 U ) 〜 （ d ) 是等价的. 

根据矩阵乘法的技巧， tL 设表示 U 的第；列，* = 1, «. 条件 LT (7 = 1 的意思是说 

广， = 

1 1，如果 _/ 二“ 

因此，[厂 U 二 I 的另一种解释是，1/的各列是标准正交组， Wi ( ij ( s ) 与 （ e ) 等价.同理 （ d ) 与 （ f ) 
等价. 

如果 < a ) 成立 ， a y = lh -, 则 y J 二 〆 .二/ Jx 二: r >， 因而 （ a ) 蕴涵 （ g )， 另一力-面， 
为了验证逆命题成立，苫要作稍微 fe 杂的计算‘不过，本书后面要给出的力-法将使这种计算更 

为 _ lt 接.首先考虑的情形，假定 （ g > 成立，并且设我们得知， V - 

.，(_/• 的 1, 1元.类似地，得的2, 2 JEiiifi J . M 而[尸 " 必 

须有形状 
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其屮，^是 U 的第1列与第2列的内积，而 u 是第2列与第1列的内积 . ft ( g ) 中设 _r = ^ 

然后再作计算，因而得知， y --. rU ^ Ux -2+ U ^ a ). = 得知2 = 21 

i ( a ~ a ). 因此， a+a = 2 Re «=0, 9_ a — a _ = 2 !'lma = 0， 从而 u 二 0. 这就是说，如果对所有 
c z , jc - U - Uj :=^^, 那么 L/.U = I ; 即 U 是酉矩阵（如果 L / GMp . 现在考虑 n >2 的情形，且 
设 A 二^ U . 假定 2 6(7 是这样一个向置.除 T 第*个和第）个分量以外，，它的所有分 
量都是0.于是 


.r * Ar = I' ， ; 」 A( W' ， j})[ 」 ]. 

[见 (0.7. 1) 关于 f 矩阵的记号],因此，刚才 ffi 明 T ( g ) 蕴涵 AUr , y )/ = ? eM 2 . 因为：和 J 
的任意件，得知 A 的每个 2 X 2 主子矩阵都是 2 X 2 单位矩阵.正是这个八有八=1£财„，又因 
为的情形是显然的，因此得出 （ g ) 蕴涵 U )， 证毕. □ 

2. 1.5 定义一个线性变换 C-C" 称为 Euclid 等距变换.是指对所有 .r6C", 有^> = 
(7 W ( T >). 定理 (2.1.4) 是说，一个复方阵 U 6 M ,, 是一个（经由 U : 山的） Em :! k ] 等距 

变换当且仅当 [/ 是酉矩阵.关于其他形式的等距变换 51 5.2 节. 

练习设 


™) = [— ，， 

L— *sui@ ros 沒」 

其中 々是 一个实参数. u) 如果 U6M 2 ( r )， 证明， u T 是实正交矩阵，当且仅当 i/=r (⑴或 

n 


U 


Lo 


二] 


T ( 6 ) 


对某个阳 R 成立. （ h ) 如果 uettOO , 证明， U 是实正交矩阵，当且仅当 t /= TW 或 


U 


对某个成立.我们用一个参数6给出 r 2 X 2 实正交矩阵的两种不同的表示形式，试从儿 
何上解释它们. 


2.1.6 论断如果(7, VeM , 是酉（相应地，实正交）矩阵，那么，乘枳 UV 也是酉（相应地， 
实正交)矩阵. 

练习利用 （2. 1. 的 （ b ) 证明 （2. 1. S ). 

练习如果 U ,， 々•…，是标准正交组.且 U 6/ W ,, 是两矩阵，证明山>,,…， 
是标准正交组. 

2 . i . 7 论断 A 1 中的两（相应地，实正交 】 矩阵的集合构成一个群.一般称这个群为 r , X « 酉 
(相应地，正交)群，它屉 c _; Lh ， Cl 的一个子群 L 见（0』）节]. 

练习我们知道，一个群是 这样- ■个集合，它在一个结 合的二 元运算（■‘乘法”）下是封闭 
的， ii 使得关于这个运算的单位元和逆仍在该集合中验.证 （2. 1.7). 提示：用 （2. 1.6) 验证封 
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闭忡： 矩阵乘法是结 合的； 是丙 矩阵； 且 U ' — 1 也是丙矩阵. 

M „ 屮的酉矩阵的集合 （群） 有另外一些很1要的件质.一个矩阵序列的“收敛性”概念和“极 
限”的概念将在第.「> 明确地给^ SH - 这里》了以从每个 /. j 元的“收敛性”和极限的观点来 
理解这些概念.定义怛等式 ET U 二〖意味# L ； 的每个列有 Euclid 长度1，因而 U = 没有 
•个元的绝对值比1火.如果把酉矩阵的集合#作 （5 的-*个子集.这说明它是一个有界子 
集. 如果昆一个 W 矩阵序列， 方一1，2, .... 使得所有 ; ', j=] r 2 , limw ；；'^ 

«：；' 存在.那么由恒等式 【V [人 = I . A = 1 . 2 .…. 我们若到 lim = [ I * 认 ^ 艽屮 

a —「 d . 囚此，极限矩阵认，也是两矩阵.这就是说，酉矩阵的®合是 c ’ 1 - 的一个闭子集. 

由于有限维！•: uHid 空间的 -- 个冇界闭子集是 t 集（见附录 E ), 山此可知， M ,, 中的西矩阵 
集合（群>是紧的.眼下.这个结论的最重要的推论是 F 述关于酉矩阵的选择原理. 

2.1.8 引理 iiilf ,. U : . …是 M „ 屮的已知的丙矩阵序列.則存在 .个 子序列 R … 
使得当 ； > co 时， U 的每个元(作为复数列）收敛 十一个 酉矩阵 L /, 的对应元. 1 _ 

证明：这里只耍求我们.总可以从一个紧集的任-无限序列中选 出一个 收敛子序列.我们 
已经知进‘如果一个 W 矩阵序列收敛十某个矩阵.那么 _ H : 极限矩阵一定是 H 矩阵. n 

由引理所确定的酉极限不一定是唯•的；它可能与子序列的选抒有 X . 

练习 t 虑酉矩阵序列 



址明它叫以有网个子序列极限. 

练习选择原 a (2. 也适应丁正 交群； 即，个实正交矩阵序列打.个收敛十实 if 交 
矩阵的子庁列.在实的情形，试迪过复述同样的推理验证这个结论. 

酉群的紧性在本_ 15的其他地方要用到它. 

-个酉矩阵有 u j 等于的性质 -- .种推广酉矩阵的概念的方式是要求[厂 1 相似于 li -. 
容舄看出，对所冇非奇异矩阵 .4 eM ,.， 这些矩阵的集合可以刻划为映射 /!-—A 的值域. 

2.1.9 定理设 AeM „ 是非竒详矩阵，那么， A 1 相似子4'，当11仅当存在非奇异矩阵 
M „. 使得 A — B _ wr . 

证明： 对于某个非奇异矩阵 B f M „. 如果有 AsfT ' B *. 那么， .4 — (iT ) 4，并 R . 

frAW ) Bur ) ! -(B ' B - - A 1 . 这样， A 1 可铨相似矩阵 fr 相似于 . V . 反过 

来，如果 .4 1 相似于 . V . 那么，存在非奇异矩阵 S 6 M ,,， 使得 SA ' S - ! - A -. 对 36 J ?， 令 
H . 注意到 S 4 ' sv 1 ^- e ie SA 1 ( e-'^S ') = SA ' l S 1 - A *. 另-方面， S s m 
且 . S ,; 相加这两个 tM 等式便得到 H ,- A - HA , 其中， S s * 是 Hermite % 

阵.如果％是奇异矩阵，那么，存在某个非零 j 使得0 = /^. = $1十&. 1 ~，因 

Ifij ， 一. r -二 v > s ; 厂 -ns 1 ‘ S 上 ns 1 sv -— 选取值 2«], 使一以不是 
■ s ' W 的特征值；所得到的 Hcrmite 矩阵非奇异矩阵，且有性庾 = HA . 

现存:，选取仟一复数《，便 U | 二1，目. u 不是 ,4* 的特彳 if 值.令 ) H , 其中 
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数;?异0是有待选记的，不难#出，非旮异矩阵.为广使 H ~ l B - a}lBA = B ' . 

经汁算， B ' - [fa HA -/?{«；- A ' ) HA - jKuHA /\' / i . A ) = ,3( a ffA - H )= 

HUilA - j 3 D . 如果能选定-个非零 p 使 /3= —兩，就完成 T 证明，而当《_=广时，只要取/3 = 

广^就行了. [ Lzo __ 

习题 

1. 如束 [； eM „ 是酉矩阵，证明 I det | — 1. 

2. 如果 AGaa /), 而 L /6 JW „ 是酉矩陴，址明 U I =1. 提示： 利 ffl 等矩性质 （2. 1.4 g ). 

3. 给定实参数出.良，…， A , ,证明 

[./ — dm e (^' ，•■■， 〆 、） 

足西矩阵. 

4. 说明实对角正交矩阵的特征. 

o . 证明 M „ 中的贵换矩碎（0.9.5)是正交珩阵.并 W ■:明置换矩阵构成实正交矩阵群的-个 
子群（这 t 子集本身是一个群）.在 M „ 中 A 多少不 N 的晋换矩阵？ 

fi . 你能给出 3 X 3 正交群的一种#数忐示形式吗？想_想本节屮给出的〗 X 2 正交群的两 
种表示形式. 

7. 对定理 (2.1..1) 屮条件 ( g ) 蕴涵条件 （ a ) 的下述另•个证明作详细的论述.证明 （ g ) 表示 
对所有 . rec " 有 t ‘（（；• U 1)x^0. 设 H = LT L / — f 并且注意到 f / — fT . 考虑 (J 二 （1 十 

hu 十，. V )，則所有 t , 和所冇 & r . 展汗这个等式并证明对所冇 j .. . vec -有 

X * Hv - o . 系统地选取 .r 和 Y 可得山 H -0. 

8 . 适合 AA 「 /的矩阵 AtM ,, 你匁正交矩阵. 一 t 实 il : 交矩阵足两矩阵，但一个非实 iT : 

交矩阵不一定 是两矩 阵. （ a ) 设 


roll 

K - 6 MjtR ). 

L — 1 0」 

证明，对所有 fGR , / UM ^ CDDshm . l - GsinhMK & M .」 是止交矩阵，似只冇/二0时 .4(/) 才是 
两矩阵.其中，双曲函数定 义为 ⑺ sh 丨 m sinh=(〆 f f )/2. ( b ) 证明，弓 K 矩 

阵小问 的足. H 正交矩阵的 ft 合小是有界集，凶而它不是紧集. （ c ) 证明，跟西矩阵一样，一 
给定阶数的所有 M 正交矩阵的集合构成一个群.乜管如此，通常的做法是.正交群这一术语 
专指一个由给定阶数的所冇实正交矩阵组成的较小的（紧）群. （(1) 若 A 6 M „ 是 ih 交矩阵，址明， 

I det.A | -1, 但可能有特征值 A 适合 | A | 关 1. 提示： 考虑 U ) 中的证明 | A ( f ) | 可以 
ff 意大. O ) 若是正交矩阵，证明 A , / V 和 -4* 都是正交矩阵且 A 是非夺异的. A 的 [ U ] 
漭行或诸列构成 TH 交组吗？ （ f ) 说明对角正交矩阵的特征.与习题4比较.为避免浞淆，冇的 
作者称不一定是丈矩阵的 IF 交矩阵为复正交矩阵，仴是在文献中.般不明确这种 区別； 术语正 
交矩阵有时是指我们所称的实正交矩阵， . 

9. 如果是酉矩阵，证明 n , [ r 和 u •都是酉 矩阵. 

10. 如果 [ J 6 A 1 是酉矩阵.证明， jeCIF 交，当且仅.当 L / J . 与正交. 

11. 称非奇异矩阵 A€r At 是 斜正交 矩阵，是指 A _| 二 一 A T . 证明， A 是斜正交矩阵，当 
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上1_ 仅当士 m 是 m 交矩阵.更一般地，如果 eeR ， 证明 ， a '=^ a t , 当且仅当， ' 4 是正交 
矩阵.当时.它是什么 V 如果6 1 二0呢？ 

12. 证明，如果 .46 M 7 相似于个酉矩阵，那么 A 1 相似于 / V . 

13. 考虑矩阵 .-\ = di ag (2, 证明相似于酉矩阵的所有矩阵的集合是其逆 A 1 相 

似十 / T 的所有珩阵 A 的集合的一个真 f _ 集. 

14. 证明 M „ 中的西矩阵群与 M „ 中的复正交矩阵群之交是 M „ 的实正交群. 提示： 考虑 
[/ 二 A 十出，其中 r /， A , BeM „. a A . k 是实矩阵.如果 u 既是酉矩阵，乂是复正交矩阵， 
证明从而.对每个标准基向 Mr & R "， （&)\也,）=0，因此 B 的每个列都是 0. 

进一 步阏读想了解关于适合定理 (2. L 9) 的条件的推广的酉矩阵的更多信息，可参看 C . 
R . DePnma and C \ R * Johnson , "The Range of A 1 A 1 in G 7, < n , CU ” Linear Algebra 
Appi . 9(1974), 209-222. 

2.2 酉等价 

因为酉矩阵 [./ 有[厂二 (_/ 1 , 所以.加果 [/ 是丙矩阵，那么由 A — LJMU 给出的 M 上的 
变换是相似变换.这种特殊的相似形式称为酉相似或 W 等价. 

2-21 定义设矩阵 A , BeM „. 加果存存:丙矩阵 tieM „， 使得 E = U '4 U , 就称 B 商等价于 
[Jll A . 如果 L ; ■以取实矩阵 （ 因而是实正交矩阵）.那么就称 iK 实）正交等价于 A . 

练习证明两等价是一个等价关系. 

2 ,2.2 定理加果 A 二[〜]和 B — L \」 eM „ 西等价，那么 

E i ! I 〜亡、 i 2 . 

证明：作矩阵乘法后便可看出 I \ p - tr -V .4. W 此只要验证 lr iT B = uA 就够 

T - 如果则 W 为迹是相似不变景.就有 iriTB 二 tr [ n (7 Lr .4 Lr = t r [： nA [>= 
tr H Q 

练习定理 （2. 2. 2) 说明 tr A " A 是酉相似不变量.不用 A " A 还可以作出另-个证明.不 
过要利用上一节的 结果： 用一个两矩 阵乘- .个向量不会改变其 Euclid 长度，要注意的是，从 
41做起的矩阵乘法是乘被乘矩阵的各列，而从右做起的矩阵乘法是乘被乘矩阵的各行. 

练习证明 



相似，但不 H 等价. 

N 为两等价蕴涵相似，似是反之不成立，所以，与相似等价关系相比，酉等价关系把 M ,, 
划分成更细的等价类.跟相似一样.酉等价对应一个基变换，不过它是一种特殊形式的基变 
换--它把一个标准 iF _ 交基变成另一个标准正交基.基的标准正交变换不改变向量的各分量的 
绝对值的平方和，而这个量在基的一个非标准正交变换下是可以改 变的. 因为求共轭转置要比 
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H •算逆荇易得多，所以在计算上.門等价 JG 系要比相似关系更简单.仵出现舍人误差的情况 
卜， 它也能较好地保证精确性.因此，在数值计算中，它是可取的.关于这方面的细致理由就不 
作这里阐述了，佴是.可以作一个直观的解释，那就是用一个酉矩阵做乘法有保持长度的性质. 

下述两种特殊的（乂很简单的）酉矩阵形式给出两种酉等价变换，它们在特征值的计算中非 m 
常电嬰. 


2.2.3 例： 平面旋转设 


- sin 0 




它相当 于一 个单位矩阵，只是它 的！， f ' 元和 ./. J 儿代之以 COS 而 N 几 （相应地_/，！_元） 
用. sin 汛相应地 sm ⑴来代替. 

练习对于任-对指标和任-角参数0«0?<2^验证 Ud 厂是 M ,〔 R ) 中 
的 TK 交矩阵.矩阵^ _)) 只是在 ） 坐标平面中作-个 M 角的）旋转.值得指出的是，左 
乘以 )) 仅刈被乘矩阵的/行和）行有影响，而右乘以 U(£? ; ^ J) 仅对 f 列相 j 列有影 
响，因此， 经 uah i . j) 的丙等价只使；， J 行和 i, J 列有变化.经平面旋转的酉等价是计算 
持怔值的 Jacobi 法和 Giv t >ns 法的基本特征. 


2 . 2 . 4 例 Householder 变换.设逛非零向量，定义 e _ M ,, 为 U ^ = l ~ tww ' ,其中 
/ = 2 Cw *7£；) *. 注意，而 w/ UJ 是 一个正 纯; M：. 如果 W 已正规化 Cto * W 二 1) ,那 
么，/ 就是 2. 而 〖尺 .就是/ 一 2^1^'• 我们常常是在假定 W 已经正规化的前提下给出矩阵 

练习证明， U „ 在补 子空间 TT 上相当 于-个 单位变换，而在由 U ； 生成的一维子空间上 
相当于一个 反射； 即.如果 J ■丄 W . 则 L ^. r =, r . 而(7„屮=一 W . ( rT 4 J 

练可 证明， 14 既是两矩阵，也是 Hermite 矩阵（⑴= ). 形如！7„的矩阵称为 
Householder 变换.经队 . 的酉等价有时也叫做 Householder 变换.这些变换在本书中要多次 
出现，其中包括汁算特征值的 Householder 法（见习题 4) 以及其他酉简化方法.值得指出的是， 

H 0 useho Id e r 变换一 般变更它们所作用的矩阵或向 ft 的所有元素，但是，它们为许多应用提供 
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非常有效 Ifil 精确的简化. 

定理 (2. 2. 2) 给出了两个已知矩阵酉等价的-，个必要而不充分的条件.我们能在此基础上 
冉添加更多的恒等式，这些恒等式共同给出两个已知矩阵酉等价的必要充分条件.其中，下述 
简单概念起着关键的作用.设^ f 是两个给定的非交换变元，称(的非负整数幂&任一有 
限形式乘积 

W L 、 - ， f) = 广广 /: 广 … ， ni] - ii] . **■/ij. , t\ L ^ 0 (2, Z. 5) 

为災十 ^ 和 f 的字 * 字 W (，、' /) 的次教是非负整数 L 4 r f … r 叫十?^即宁屮的所 
右指数之和.如果 □知 我们可以形式地定义 d 和 A ' 的字为 
W ( A，/T ) — A " ! . ( A ， y、AW 广 … AW )' 

由于 .4 与 A - 的幂末必交换， 试图® 排乘积中的项來简化 W 14. A -) 不一定可行. 

如果 A Ff 等价于某个 Be M „, 那么，对某个丙矩阵 / I -[/ fit .；- , II .不椎算出 
W(A.A' )- (IJBW (UB'ir )" -(UBU' )™> (UB ■ IT 
-= LIB"- U' U( /r )"|( . 广 …[ 出 -"*( ：厂 [/(ir )">(；■ 

— UB ,a ' ( B ~ )"' )、W 

= UW ( B , B ' )1)'. 

Win〗，tr W(A, A' )-tr VWUi , B - ) U ' = trWiB , W ) 如果取字 W (.、.， !. 卜！“ 就得 到定理 
(2. 2. 2) 中的 作: 等式. 

对所冇 nj ■能的卞 W (.、，/). 述结果给出 fW 个矩阵是 洱等 价的 Jl 限多个必要条忭 . )： 
面.我们小_加证明地叙述 w . Sfwht 的一个定理，这个定理确认这无限多个必耍条件同时也 
l 7 T 是允分条件. 

2.2,6 定理两个已知矩阵 A ， 狀风酉等价，当丨 I .仅气 

tr W ( A . A ' ) tr ) (2* 2. 7) 

对于两个非交换元的每个字 f ) 都成立. 

Spcrfit 定理只能用来证明两个巳知矩阵不酉等价.然而，除廿在一些特殊情形（见习题 
〔0,它存:吣明两个 d 知矩阵是西等价时可能大效，因为必须验证X限多个条 fj . 幸运的是，冇 
一个定理对 Sptrht 定理作了改进，它属干 C . Pearcy . 这个定理说明，只要对有限多个字验证 
迹恒等式 (2.2. 7>就够厂 

2.2.8 定理两个 Li 知矩阵 A ， 阿等价，当且仅 4 tr 妒(/!， A ' ) = tr W ( B , B * ) 对次 
数至多是2,的每 个字呀 f ) 都成立. 

Pearry 定理中的有限限制是对 Spcdu 定理的.一大改迸，但是，如我们所知，这还是非常 
保守的.当》= 2时，只要对二个字 IV (,，/) =，, /和 h 验证迹悄等式就够了.无需考虑次数 
全多 12(2):* 二8的所有字.当"= 3时 ， fl 要对9个字研 （ s ，/)- s , y ( , //. 

H ts ” s 和验证迹恒等式而用不着考察次数至多是 2(3) ? - lK 的所有字. 
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习题 

1. 设 A =1 〜] 6^(1^ 是对称矩阵 （4=/^, 但非对角矩阵，井假定选 T 标* 使得 
I \ I 越大越好.用 (< J » 心 ）/2\— mU 2£0 定义 (?， F ). 设 U (的 h j ) 是如 (2. £.3) 中所得到的平面 

旋转.用 （2. 2. 2) 证明，如果 B—[ ⑽ j )' AU (0； u .,) = (*,), 那么 E I 2 < I 1 ? - 

说明累次应用这样的平面旋转(用上述相同的方式对 B 和它后而的矩阵^相应的选择）会缩小 
各非对角元的平方和而保持所有元的平方和 不变； 每做一步，所得到的矩阵就比前一步更接近 
于幻角矩阵.这就是计算一个实对称矩阵的特忏值的 JarotM 法.这个方法产生一个实对角矩阵 
的矩阵序列.为什么极限矩阵的诸对角儿必定是 .4 的渚特 征值？ 

2. 关于实对称矩阵（或一般的实矩阵）特征值的 Gmms 法也是利用〒_面旋转，但采用的方 

式有所不同.证明，一个对称矩阵 A 经若十平面旋转后 IK 交等价于-个二对角 

(对称）矩阵.而一般的 Ae / W „( K ) 经若 f 平面旋转正交等价于-个 （ K ) H essen b erg 矩阵.关 
r - -:对角矩阵和1{^；^山。1^矩阵可见（0.9.!))和（0.9.10>. 提示： 选一个平面旋转 l ； u 使得 
UkAUu 的1，3元为 0. 选另一个平面旋转使1, .1 元为0,继续做下去3到1, m 元.然后转 
到2, 4元，接着做下去.注意，这样一步步做下去不会影响前面已经选定的0元；并且正交 
等价保持对称性不变.一个_对角矩阵的特征多项式是容易确定的， Ifij 其特征倌可用求根的方 
法来确定.注意到经过有限多次平面旋转后 Givens 法得到 个 三对角矩阵，但它不会显现特 
怔值或特奸向童，不过利用另外的汁算一定能得到它们. Jaccbi 法一般不会经有限多次平面旋 
转后中止.但它的3标是 产土一 个对角矩阵. Ifuli . 得到_个标准 TF 交特征向量组. 

3. 证明，毎个矩阵西等价于一个有相同主对角元的矩阵.提示： U ) 若 AGA 4, 
考察 .4 —(1/2 )( lr AH , 证明只需考虑 trA = 0 的情形就行了.若 . r € C 2 是一个使 /Ar = 0 的 
甲位 向量，设 u —「 x , . vie 竓是 ■个酉 矩阵，说明 mu 的],1元为零，并 H . 利用迹条件 
证明其2, £元也为零-为了求这个向景^ ^是属十 A 的两个特 征值土 A 的特征向量. 

如果 A — 0, 取如果 A 尹0,设 j '(6>) 二 〆 to + s ; 址明，对所有有丁<(?)浐0,面对某 
个 U 6 R 有 . H 0 ：r A . r (0)= O ; 对这个 ia . r - x (3)/ r . r (0)' *. 如果 容易 

构造一个（实）平而旋转 U = U ( fl ; 1， 2) 使 [/ T /\ U 的对角元相等，但这 / f _: 复的情形是行不通的. 

定义 /( A): ma xi I a„~ a , r I : j =- l , 2, «}, 并且设烏 ^" l , 其中指标偶“』 

L & a ,, 」 

适合 ./(A>— I n, 1 . 设足使卬 A 2 U? 冇相冏主对角元的酉矩阵.如同 （2.2.3) 中 
从 2X2 平面旋转构造 [JM; j), 用同样的方式从 K 构造 U(i. ;)eM„, 并且证明，如果极 
大对角元之差不是多个可取差，则/([/(，， AU (>, j ) Xf ( A )； 杏则可以重复上述构造. 
可以断定，如果 /_(A) 尹0,则有丙矩阵 UGM,, 使 /(rr .4W</(4). s ^(A) = {L7* AU ; 
UeM„ 是两 矩阵丨 ，证明 K(A) 是紧集井注意/是尺 （A) 上的连续函数.设 L:6J?C4) 适合 /(£：) 
Se^(A)}, 证明 /(C) 不成立，因而从 /(C)— 0得出结论成立. 

，1.证明，用 nouseholder 变换可以把 一个貝 .有 Euclid K ： 度 r = ( /_ 2 的仟一向量 x € R 
变成长度为 r 的任一其他向 MyeR "， y 々. 提示：试用.证明，其中 w = ^ — 如果& 
ver 你能得出什么结论？ 
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5. 计算 A f M„ (R) 的特征值的 Householder 法如同 Giv ens 法，先把 A 化简成 （U 
Hessenberg 矩阵(或在对称的情形化为7对角矩阵）.构造性地证明，其第」列中的第 （j + 〗 ） 个 
元素以后均为…，幻的形如 




a * 


X ¥r ; 


0 ... * 


_ 0 



A 行 

■(*+ 1 ) n 


t 

办列 


的矩阵，经一个用 Householder 变换所确定的实正交相似可以变成一个同形的矩阵.由此得 
出，任一个矩阵/\6轧（10都可以经一系列（„--2个） Householder 相似化简成』„ Hessenberg 
矩阵，而一个对称矩阵 A£M a (R) 可用同样的方式化简成7对角矩阵.揾示：对于第 （S + 1) 
列，选一 Householder 变换 UeM„ ，把出现在对角线下方的诸元素组成的 U—H 维向量变成 
[1，0,…， 0] r 6R" ( 的一个适当倍数.于是迕由正交矩阵 

CO 

确定的相似可变换整个矩阵，并目.看到所想要的0 f 块 ,1} 现了. 

6.设/\6财„和丑， CeM„ 是给定的.用 S P «，tu 定理 （ 2 . 26) $P ea r Cy 定理 （2. 2. 8) 证明 B 
_ C: 酉等价，， FL 仅当下列诸条件下的任一个成立： 

O [:: J 两等价 . 


Cb ) 


B 

0 - 

1 

_ C 

0 - 

B 


和 

C 


. 0 

B _ 


0 

c _ 

A 

0 - 


_ A 

0 _ 

B 


和 

| 

C 


. 0 

B \ 


. 0 

'C _ 


ft 等价，其中两个直和有相同的项数. 


酉等价，其中两个苡和有相同的项数. 


7- 'I■止明.诸某个次数 A 有 2* 1 t 不同的形如 （2.2. 5) 的字 W( s ， /)，因而得出至多有 4« z 
个次数至多为的不同的字. 

8. 试给出两个 2X2 矩阵，这两个矩阵满足恒等式 （2.2.2), 但它们不酉等价.解释其 
原因. 
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进一 步阅读与注释 关于定理 （2.2. S ) 的原始证明可参看 W . Specht t "Zur Theone der 
Matriztn \\^Jahr^^herukl der Deutscken Mathematiker Vereinigung 50(1940), 19 23. 定理 
(2. £. 8> 的 Mi 明可见 C *. Pearcyi Complete Set of Unitary Invariants for Operators 
Generating Finite W ' -Algebras of Type I , ^Pacific J , Math , 12(1962), H 05-1416. 关十低 
阶矩阵丙等价的讨论可见 C , Pearcy，“A Complete S^t of Unitary Invariants for 3 X 3 Complex 
Matrices , f > 7^ Amm Math . Soc , 104(1962), 425-429. 

2.3 Schur 酉三角化定理 


初等矩阵理论最冇用的基本事实或许是任一矩阵 A ^ M „ 西等价于一个上三角矩阵了[也西 
等价 ; F — T 二角矩阵]. T 的诸对角无自然是 A 的特征值.尽管这种形式不唯一，但是它是在 
H 等价下所能得到的最简形式. 

2.3.1 定理 ( Schur ) 已知有特征值义，它们按任意规定的次序排列，那么存 
在•个酉矩阵使得 

t /’ AL 7 = T — \_ t ,, 3 

是具有对角元 f ,,= A 」，1-1. ” 的上二.角矩阵，即每个方阵 A pf 等价于其对角元依次是 A 
的特征值的三角矩阵.此外，如果 AeAUR ), 且 A 的所有特征值都是实数，那么，可选择17 
为实正交矩阵. 

证明： 证明本身就是实施一系列相同形式的化简算法并得到化简结果.设. z .⑴是 A 的相应 
于矸特倌夂的正规化特征向量.非零向量可以扩充为 C " 的一个基 

，，y w’y-' lic 

应用 Gram - Schmidl 标准正交化过程 （0. 6. 这个基，便得到 C " 的.个标准正交基 

从左至右把这些标准正交向量排成两矩阵 [ A 的诸列.因为 AU : 的第丨列是; I ,/ 1 '，计算表明. 

U ； ( AU t ) 有形式 

u t - MJ, = r A '- , * 1 

* L 0 1 Ai J 

矩阵次，有特征值&，…，设是八的相应于义 2 的正规化特征向量，然后 
完全重复上述步骤.确定 个 酉矩阵 A ，使得 



V z = 


c .. g } 


十是，矩阵 k 和 是两 矩阵，因而 wtirAu,% 有形式 


VV u ： au , v 2 
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继纹作这种化简便到酉矩阵 2 - 1 , 1和酉矩阵 v , e / w „, /= 2 , »- 1 , 

矩阵 

u = L7 】 V 2 H 

是两矩阵，而 U _/\ L 7 给出了所要求的形忒. 

如果 A 6 M „( R ) 的所有特征值恰好是实数，那么.相应的特征向 * 可以选实向量， a 上述 
所冇步骤可以用实的算术运算来完成，这就是证明了后一个论断. □ 

附注 仿照 （2.3. 1) 的证明便可看出，在定理的叙迷中，可用“下三角”代替“上三角”， 

当然它对应于一个不同的酉等价 U . 


L^j 2.3.2 例不论是两矩阵 U ， 还是定理 （ 2 .3. 1) 中的二角矩阵 T ， 都不是唯一的.不仅的对 
角元的特征值）可以依仟何顺序出现，|〖1!〖1酉等价的上-:角矩阵在其对角线方可以呈现完 
全不问的形式.例如， 


是经 


的两等价. 
附注 
技巧. 



'I 

i r 


T ,= 

0 

2 2 

和 = 


_0 

o : L 



3 V 2 


U 



-1 0 
0 V2 _ 


■般说来，许多+同的上-:角矩阵可以在同 - 个两等价类之屮. 

应栺出的是，证明 （2. 3. 1) 的技巧不过是如丨 ■ 4节中习题8所概迷的顺序压缩 


练习如果 A = 和 B = JW_ ，相似，且 2 … UJ 2 - 丨〜 I 2 ,证明 A 和 B 

酉等价.用例子说明这在高维情形不成 i . 提示： 沣意 到，如果 A 和 fi 西等价，那么 A — /V 和 
B \ ir 也酉 等价. 考虑 



「1 3 r 

| 1 0 0- 

A = 

0 2 4 

和 B 叫。 2 5 


_0 0 3 - 

Lo 0 3 


(2 - 3. 〗 】 的有用推论是，矩阵交换族可以同 时上三 角化. 


2. 3 ‘ 3 定理是交换族.邵么存在-个酉矩阵 U6M， 使得对每个 Af A L/'Af/ 是 
上=角的. 

证明：冋到 （2. ：?‘1>的证明.在原证明的每-步运用 （1. S. I? 1 ), 在每一步都可选定一个特 
征向量（和 F •(矩 阵），II对每个都可以选定这同一个特征向量（和两矩阵).又西等价保持 
2l"i 交换性， IL 分块矩阵乘法计算*明，如果形如 

[ A „ A,1 r fill 

L o a ?£ 」L o 知」 
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两个矩阵可交换，那么 A ;2 和私 2 也可交换.因此，在证明 （2.3. 1) 的化简过程中的每一步，每 
个八都继承了交换族性质.我们得出，对交换族的所有成员，可用相同的方式选择 (2.3.1) 的 
!_/中的所有组成部分，这就证明了 （2. 3. 3). 值得指出的是，这甩并没有断言，对各个族的成 
员的特征值，可以选取任一特定的次序.它取定的 R 是应用 <1.3. 17) 时所得到的那个次序 .□ 
下面的定理包括了 （2. 3. 1) 的严格的实形式. 


2. 3.4 定理如果 AeM„(R), 那么有实正交矩阵 QeJW„(R), 使得 




Q J AQ = 


A , 


e m„(r), l < ^ < 


(2. 3. 5) 


L 0 八 

其中每个 A, 或是] XI 实矩阵或是具有一对非实的复共轭特征值的 2X2 实矩阵.对角子块 A, 
可以按任意的次序排列. 


-般说来，不能指 M 通过一 t 实相似（更不用说实正交相似了）把一个实矩阵化成卜_三角形 
式. 因为可能的话.对角元将是特征值，咁特征值可以不是实数.形式 （2. 3. 5) 是通过实正交 
相似所能得到的与二角形式最接近的形如果 .4 有任何非芄特征值，形式 （2. 3. 5) 就不会是 
i ： 角矩阵，何它总是呈上 H 咖 eriberg 形状. 

练习试修改 （2.3. 1) 的论证以证明 （2.:i. 4 )，提示：如果 A 是实矩阵 A 的寬特征值，那么 
冇 个 相应的实特征向量，可以用它来压缩 A, 使呈 （2.3. 〖）中的形状.如果 A = a + 是 A 的 
非实特征值，且九 t，一 ^ = M-h iv ^-0 r u y vt R f % i£ 明 Ah — —扣 十和 和 Aj， 二 
；U， 再 llF. 明 U，3 是无 艾组，证明 U，W 是无关组，然后刈它应用 GrairrSchmuJl 过程得到实 
的标准正交组{比， d. 设“是前两列为^和 r 的实止交矩阵，证明 
^ ^ : 

Q?aq, = - ..........*. . * ， 

_ 0 : A 

这时，一次可使4压缩两列.应该指出， ^(2. 3. 5) 中，相应于每个实特征值和每对复共轭特 
征值的子块 A , 可以按任意规定的顺序排列. 


(2. 3. 3) 也有一个在实的情形下的变形. 


2.3.6 定理设 是交 换族.则#在实止交矩阵 Q 6 M „( R ), 使得对每个7, 
QMQ 为 （2. 3. 5) 的形式. 

练习试修改 （2. 3. 3) 的论证以证明 （2. 3. S). 提示： 首先，用所有实的公共特征向 MM 缩 
/的所有成员.然后考察非实公共特征向量， F1. 如 （ 2 . 3. 4 ) 的证明所做的那样一次 M 缩两列. 
要注意的是， 经一 个公共的实正交相似之后，5的不同成员可以有不同的2；<2对角子块，但 
S， 如果-个成员在某个 位置冇 个 2X2 : T 块，阳兒一个成员却没有，那么后者必须在相应 
位 K 有一对相同的 1X1 子块. 


可题 


5 -设 .，.ecr 是给定的单位向量 u:r=])，M.iEU— [々，/」、其巾. qec, 而： v,ec" 
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选取使然后定义 z = = f ]， 其中 a eR 是非负实数，而 teC 1 — 1 ■证 


明矩阵 


是酉矩阵. 提示 ：计算 V*V=^. 得出矩阵[/是其第一列为已知向量 •! 的 
酉矩阵.这为 Schur 定理 (2. 3.1) 的证明中的逐个压缩步骤，提供了一个求所需酉矩阵的构造 


[Ml 


性方法. 

2. 如果: r 6 R " 是给定的单位向量，说明如何改进习題1中所描述的构造法，以便得到第 
—列是1的实正交矩阵 Q 6 R ( r ). 证明你的构造方法是可行的. 

3. 设 A & M „( R ). 解释 A 的非实特征值(如果有的话)必须成共轭对出现. 

4. 考虑 p 

试说明定理 <2. 3. 3) 中的交换性假设虽然是 f 可同时酉上三角化的充分条件，但它不是必要 
条件. 

5. 设^={义，…，是给定的族，且设 

爷 = {AiA } ： i,j = 1 ， 2 ,…， 

是萝中矩阵的所有两两乘积组成的族.事实上，如果货是交换族，那么， F 可以同时酉上三角 
化的充分必要条件是每个换位子的每个特征值都是零.证明关于$的交换性假设 
是比5的交换性假设要弱的假设.同时证明，习题4中的族 f 有一个相应的交换族它还满 
足零特征值条件. 

6. 设 A , 已知，且假设 A 和 B 同时相似于上 H 角矩阵；即对某个非奇异矩阵 S 6 
S ^ AS - S ^ BS 都是上三角矩阵.证明 AB — 的每个特征值必定是零.提示：如果 

A ,, ^€加„都是上三角矩阵的主对角线是什么？ 

7. 虽然每个方阵可经酉相似化成上三角形式，但这对复正交相似不成立.如果某个 A 6 
可以写成力=0。(3' 其中，是复正交矩阵，而 A 6 JVf „ S 上三角矩阵，证明 A 至少 


有一个特征向量•使考察 A : 


_^，试说明不是每个可以经一个复 


正交相似上三角化. 


8. 设 QeJVf, 是给定的复正交矩阵，且假定是 Q 的相应于特征值 A 弇 ±1 的特征向 
量- 证明工\ = 0. 提示： 在恒等式的两边各乘以 g 己的转置.关于两个特征值都不 
[84] 同于士 1的 2 X 2 k 正交矩阵族的例子，可参看( 2 .1)节的习题 S ( a ). 证明，这些矩阵中没有任 
何矩阵可经正交相似化为上三角矩阵. 

进一 步阅读 关于习题5所确立的定理 (2. 3 . 3) 的较强形式，其证明可参看 Y.R Hong auci 
K - A . Hotn , “On Simultaneous Reduction of Families of Matrices to Triangular or Diagonal Form 
by Unitary Congruences Multilinear Algebra 17<198 S ), 271-288* 
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2.4 Schur 定理的若干推论 

Schur 两 '角化的几个 * 本推论说明了它的效用. 

练习利用 （2.3.1) 证明，如果有特征值入，…， A „， （包括重特征值），那么 

d et A =_ fj >, 和.在第1章中，这是用另外的方法证明的 .提 示：关 于迹，应想到由 
1 = 1 >1 

直接计算可推出 trAB = tr£/U 因的迹是相似不变量.关于特征值的其他初等对称函数，你 
认为如何？ 

每个矩阵都满足它自 d 的特征方程 （2. 4.2), 这个结论可由 Schin ■定理和关于=角矩阵乘 
法的一个简单结果推出. 

2. 4.1 引理假定 K =[ r ,,」 和 T = U ,]6 M „ 是上- :角矩阵， 且％ =0, j ^ k < n , 

设 T ' = [ f ',]= ii 7'， 那幺4.=0 ， Kit j^k 4 1, 

证明：因为只 （1. 2,…，0=0和所以 fi 和了有形状 


1 


关 _ 


()‘. 


* 


* 



， 


0 

0 ... 




¥r 





0 

0 并_ 


其中.分块后的 A 上 f 块都是 AX6 的.根据分块矩阵的乘法[见 （0.7) 的有关记号和基本结 
果], T ' 的左上 f 块显然是 0. 通过观察发现，只的前 （十] 行有0的位置对着了的第是十 
1列的所有非零位置，血 r 的前々+ 1列有0的位置对着只的第 A+1 行的所有非零位置.于是 
矩阵乘法表明， 7" (按同样的分块)冇形状 

0 - 
:: * 

0 ! 0 

T' - ' : 0 . , 


L ： 0 0 *」 

因而尹 （U , …，这正是我们要证明的. □ 

练习 证明两个上角矩阵的乘积是上一.角矩阵，并证明两个冇相同划分的分 块上二 角矩 
阵的乘积是分块上二角矩阵. 
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圍 


练习推广 （2. 4.1)，证明，如果 K 和了是 h 二角矩阵 .R r - RT , 那么， 
广（ + 1 ，...，!■+_/!■)= _ R ( { + 1 ‘… J 十 P ) T ( {!.，；!■+ 1 ,… W + P ). 


2.4.2 定理 （ Gayley - Hamiltom ) 设 h ( f ) 是 A6 M „ 的特征多项式.那么 
fi 、（ A) — (X 

证明： W 为是 n 次的，且首系数为1，又 h ⑴ — 0的根正是 A 的特征值 A 1 ，…， A ,, 
(计相重特征值），吋以把⑺分解成 

Pa (t) ^ (t — X [ )(t — 

利用 （ m )， 把 a 表成 


^ - utxt , 

其中 T 是上三角矩阵， ti 在它的第 2 个对角元位置有 A ,, ;=1,…， „. 现在算出 

pAuru- > =■ ([mr -x.ihutv — aj) … ar ， u. -a 0 J) 

— [ urr — Ajn /. 1[ U ( T - AJ ) U 1 … [[7 (T — 

-=t/L(T-A,7)(T-A : ，/)-(T A„j)]U' 

- UpATHT ， 

并注意到， /u(A) 二 0 ，当且仅当 hCr)—0. 此外，由引理 （ 2. 4. 1) 得出 /) A (7 ，）一 0. T-A, 1 
的左上 1X1 子块是 0. 而 r-Aj 的 2, 2 元是 0; 因为它们都是上二角矩阵，所以 （ T-AJ) 
( 了一 U) 的左上 2X2 子块是 0 ，根据 ! H 纳推理， 因为 （ r—AJ) 的左丄々 X 左 f - 块和 
(r—AmJ ) 的左 + 1 , 々十 1元各为 0 . 且都是 t 三角矩阵，所以 （ T—AJ) ,+•(•』'— Am J ) 的左上 
u t ]) 乂（々 +1)+ 块是 0. — 直连续计算到 L 便得到乘积 p^T)^cr-x l !)-(T-U)-o, 
证毕 . □ 

练习下述关于命题 /M(A) — 0 的论证有什么 错误？ •'因 >J 对于 A&M,, 的每个特征信 A 有 
h(A)=0， 乂因为 <?(A) 的特征值是 g(A) ，其中 f/ 是一个多项式，由此推出和 （A) 的所有特征 
值是 0. 丙此，户.1(.4)是 0. ”这是关于 Cayley-Hamilton 定理的 - 个常见的错误讪明.给出了一 
个明显的例子来说明它错在哪里. 

练习下述论证的错误是什么？ ,l ia^ p A (, t ) = de \( jI - A ), j> A CA) = det(A 卜 A)=dtt(A — A)=- 
det 0-0, 所以 p A ( A )-0 ,! . 

如果 h(f) = doi(f/ A) 表承 AeM,, 的特征多项式，那么特征方程是九 （n = o . 特征方 
程的根是 A 的特征值. Cayley-Hamihon 定理常常解释为“每个方阵都满足自己的恃怔方稈，， ■ 
fii 这必须认真弄懂：纯 M 多项式首先是作为— / Ui 十算出 来的，然后才从特征多 
项式出发作出 fe 阵 p ,( A ). 

我们已经对 Br 有 复分量 的矩陆证明 r Cayley - Hamilton 定理. 因 Irlj 它对分量敢自复数域的 
任…子域（例如，实数域或有 Pfi 数域）的矩阵也必定成立‘实际上， t : ayl ey - Hamilum 定理纯粹 
是■个形式结果.它对分讀取冉任何域的或更一般地.取卩 j 仟何交换坏的矩阵也成立. 

Cayley-Hamil 加定理的一个屯要应用是，可以把 A G M „ 的¥少 U > « ) 写成/，九 
-4%…， A" ，的线性组合.根据线性相关的理论，容易证明，幂/I:和 A 的更高次幂可以友成 
较低次¥的线性组合（闲为若把 M,, 荇作复数域 L: 的向量空 间， M., 的维数是〆），但是 〔' ay l e y 
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Hamilton 定理 是上述 结果的 M 著改进. 

2.4.3 例设 



则 = —3 H 2- 并且 A 2 —I 2 f = 0. 因此- . A 2 =3 A ZI ； A 1 = A ( A 2 ) ^3 A ! - ZA - 
3(3.4-2J) 2A-7A 6/; A 1 =7f —6A= 15.4 —11J ，等等.另外，因为 h (/) 中的常数项， 

即 A 的行列式非零.所以 A f 舒异. 11可以把 A- 1 写成 A 的一个多项式.冉由 a “A)--.V — 

；^A + 2/-0, 得到 2 /t A_」' 十 3A = A(—A + 3/), 或 

l = A[ + ( - A I 3f)]. 

这繼 |=_ 士命[: =]. 

练习已知存特征多项忒 

/ J 山 ）= r -十〜丄 r 1 4~丄…十 a " 4- 

试把#写成关 T - A 的次数至多是 《—1 的多项式.试对 .4 的次数太丁 — 1的几个相邻次数的 
幂，把它们也写成 A 的次数至多是 I 的多项式. 3外，假定 A 非奇异妾0)，把八^也' 
q 成 A 的次数至多是 n — l 的多项式.这后一结论可作为 (2. ，1.2)的一个推论. 

2.4.4 推论如采 A 6 M , 是非奇诗矩阵.那么存在次数至多是1的多项式 (它 的系数 . 
取决丁 -A ). 使得 A >- g(A). 

练习如果两个矩阵 .4. BtM,, 相似，证明其 十一个 矩阵的任一多项式相似于另一矩阵 
的冋—多项式，特别是， 个矩阵 所满足的任. 多项式 方程，另一个矩阵也满足.试考虑逆命 
题： 满足同一组多项式的两个同阶矩阵是相似的.它成立还是不成 

2.4.5 例已经证明，毎个矩阵 A6M,, 满足某个《次多项式方程.例如，特征方程就是一个 
例子.但是， AfcAl 满足一 个次数小于 „ 的多项式方程也是可能的.设 
[10 0 - 

.4 = !u 1 1 e m 3 ， 

!0 0 1_ 

则 A 满足 9 (A)=0， 其中 v ⑴二〆 一 2f+l 是 2 次的. 

练习证明一个可对角化矩阵满足一个次数等十其不同特征值的个数的多项式方程，并且 
它+满足更低次的多项式方程.个矩阵所满足的（首项系数为1的）极小次数的多项式（它的 
极小多项式 } 是下一 f： 要进.步研究的对象，它弓] ordan 标准形有密切的关系. 提示： 考虑 
At 其屮上浐火. 

心 -lmr 定理的另一个用途是，它们能用两种说法来解释每个矩阵“儿乎”是可对角化的.第 
一种说法是，存在一个可对角化矩阵，它可以任意接近于一个已知矩阵；第二种说法是 ，讧. 
匕知矩 阵相似 f 这样 一个上 ：角 矩阵. 它的非 对龟 兀可以任意地小. 
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2.4.6 定理设 A =[\] eH ,. 对任意£>0,存在 -t 矩阵泌(£) =「\匕)"|€^，它有 n 个 
不同的特征值（因而它是可对角化的），且使得 

2 I S - «« (e) 「< £• 

: > J = 1 

证明丨设 LI 6 A 1 是酉矩阵，使得 [；' 是上土角矩阵. SE = dia g h , e z ，…， a ), 
其中 o , …， t 选择这样一些数.使得 



n _ 数/ 22 十~，…，是互不相同的.（梢加思考便会发现，这是可以做到的 .） 于 
是了丄£有《个不冏的特 征值： f „+ fl , …，！„„+〜，且 A 丨 UEU ■也如此，这是因为它相似 
于 ： T 彳 K . 设 二 A | UEU ' , 从而 = —[；£■[/‘， 且 

2 - 〜 A) I ;; = 2 I 1 2 <： - ^(― )= £• 

我们已经用到丫 （2. 2. 2). 因此， A ( e ) 适合定理的要求. 口 

练习证明 （2.4.6) 中条件 2 tlJ U „— Me ) l : < e 可以用 ma Xw I MlJ -«„- C e ) ■ <』代替. 
提示： 运用丄述定理时，用^代锌 e ， 并意识到，如果平方和小于 eS 那么其中每一项的绝对 
值必小于 e . 

H 2.4.7 定理设 A 6/ V 1 •对任意 5 >0,存在一个非奇异矩阵氏 6 M „. 使得 
^ ' AS , = T e = \_ t t! ( e )] 

是上，角矩阵-且 I I < £ , 

证明： 首先应用 Schur 定理得到酉矩阵 [/ eM „ 和上一 _ 角矩阵 reAl , 使得 
V\AU - T 

对一个非零纯景《，定义 D a =diag( 1 ， a ， a 2 . … .a" [ ) 且令 / = max^ w I ~ I . 假定 £<1 , 因 
为在这种情形 f 证明本定理就可以了 . 如果设如果 f >l; 

不论在哪种情形，相应的 S , 都可证明定理的论断.例如，如果/在1,通过简•单的计算可知， 
它的绝对倌不大于乂如果 iCj , 这个值就不大于 £ .另一方面， 
如果 f > l ， 仅仅用一个经的相似作用于矩阵了，便得到其所有非零兀的绝对值不超过1的 
矩阵. 口 

练习证明 （2. 1. 7 ) 的下述变形：若 e A /„ i ] U >0 ， 则存在一个非奇异的 S , e M „ . 使得 
S t 是上 一:角矩阵，且^ I ( 6 ) |<£■.提示:应用(2.4.7),其中用[2/»(« ])> 
代替 e 

从 Schuz 定理出发不难 i £ 明它的一个推广，这个推广向 卜一 章中耍出现的 Jordan 标准形 
迈出 r $ 要的一步. 

2.4,8 定理假定 A & M ,, 有 t 1特征值 A ,， A = l , k , [ U ,, A ; 是 Tf _ 不相同的.邵 
么 A 相似于形如 
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「、。 

! ... 

LO T t _ 

的矩阵 f 其中是所有对角元为夂的上三角矩阵，；=1, k . 如果 A & MJR )，11 .A 
的所有特征值都是实数，那么也有同样的结果，且相似矩阵可以取实矩阵. 

证明： 首先应用 Schu ! ■定理 (2.3,1) 使 A (酉）相似于一个上三角矩阵 r = U „], 并且假定 
在了的对角线上作/编排，使所有的项1都出现在前面，其次是项 I ，如此等等.下面，要 
对 T 作一系列简单的（非酉)相似变换，以期得到对角线 h 方的各个0元，且不改变丁的对角 
或者上三角结构.设£„是衂„中的在 r , 位置足1,而其他位置都为0的矩阵.注意， 对； •冬 j 
和任一纯量 c 7 + 2仏是非奇异矩阵.且此外，由直接计算可对 
r <.、， 经的相似 


(H DU+D = (7 - cEJTU + ^E,,) 

只改变 T 的第 r 行中位于第 V 列右边的元素和 r 的第>_列中位于第 r 行上方的元素， 

fel 

并且用 


代替因此，如采 G /乂、， 选取 


a ^ U 
° 

便可使 r , .、元 为0,而对冇关结构未作其他的变更.现在考虑 T 屮一系列位置： （„ . 1, w ); 
(m — 2， n - 1 ) , in - Z , n )-. ( h ~3, n ~ 2 ), ( n - 3, n ~ l ), ( n ■ ■ 3, n ); ( n - A , n — 3〕， …， 
果^■芒 f s ， 可以依次指定一种相似使这些位置的每个元素变为 0, 我们注意到，这样做不会 
影响已经变成0 的元. 所得到的矩阵将相似于 A . 这正是所要求的形式. □ 

练习证明，如果 Ae / W „( R ), 且它的所有特征值都是实数，那么，在 （2. 4.8) 的证明中 
所必需的运算都可以在实数 范围内 完成，于是，在这种情形，定理保证能得到分块对角矩阵， 
而所必需的相似矩阵可以取实矩阵. 


附注假定一个已知矩阵是上三角矩阵，且可以假定它已化简成如下形式（如 
果有必要，可对它作置换相似） 


[ A ,, •■- An " 

A = j ... ;， 

1.0 ■%_ 

其中，每个对角子 块人是 上三角矩阵， JL 在其对角线上只有还假定,时有 
A,#A, ，证明定理 （ 2. 4. S) 时所使用的算法说明， A 相似于 




0 


即：在这种情形下，所有非对角于块可以用零子块来代替，且保持相似性.因为酉相 
似保持各元 - I ■绝对值的平方和 * 所以应当注意.如果有任一非对角子块是非零的， 

就不可能用一个酉相似得到这一结果. 

观在利用 Srhur 定理的交换族形式 （2.3.3) 证明，对可交换的矩阵，特征值可（按某个顺 
序广相加”. 

2. 4.9 定理 设 A ，分别有特征值 a , … ，〜和 斤，… . 如果 A 和 h 可交换，那 
么#在指标1,…， H 的一个排列， i ，…，/„,使得 A + S 的特征值是 f 成，…. 
仏‘十 I. 特别是，如果 A 与占可交换，那么 ( rM + MWAJ + ff (川. 

证明： 如果 A 与乃可交换，根据（2.3.3 〗 .它们町以同时上二角化，即存在酉矩阵 US ； 
M „, 使得 


U'AU = T 和 UU = R 
都是上二角矩阵，且分别具有对角元…， 〜及成 ，氏. 

U* ( B)U - r-l- R 


冇吋角 /L 


3! 4 /3 ：1 ,«2 \ ，― , a„ +/ i v 

W 而也以它们为特征值 .w 为 A 丨 B 相似于 7' I ；?, 所以它们必定也是 A + B 的特征值. □ 

2.4. 10例应注意的是，即使 A 与可交换，也未必所有形如《，十这的成员都是 A | B 的特 
征值.考察对角矩阵 


A - n * 「 I 

Lo 2」 Lo 4」 

便会发现 ， l + 4 = 3 fu ，6 }-^(A + B ). 因此，当 A 与 B 可交换时 ， WA + B ) 包含在(；(々）+ 
“抝中.但-般不相等. 

2.4. 11例如果 A 与 B 不交换，那么要用 ff(A)+tr(B ) 来说明 + 是很闲难的，特別是， 
tr(A + B) 不一定包含在此4)、 (抝中 .设 



则 u(A — E > = <: — 1. 'ifij a ( A )= a ( B ) — {0, i . 

2. 4 .U 例 （2. 4. 9) 的逆命题成、 V . 吗？如果 A 和 B 的特征值可按菜个顺序相加， a 与定 
可交换吗？问答是否定的，即便是对于所有纯 M a 和/?, 和! 3 B 的特征值可按某个顺序相加， 
A 与 B 也未必可交换.这是■'种有趣的现象，而刻划这样-•对矩阵的特征还是…个尚未解决 
的问题！设 
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p 4 5 - j p 1 2] 

A - ! 0 2 6 和 /j = 0 3 31. ， 

L 。0 3」 —0 0 4」 

它们的特征值可相加，彳 H . A 与 B 不交换.显然，吋冋时上三角化是特征值具有可加性的充分 
条件， m 它又不是必要的.自然，上、角矩阵不一定可交换. 

2.4.13 推论假定 A , 是分別具肴特征值 ai ，…，1和 ^ ，…， /?„ 的可交换矩阵.如 

果— !， ru 那么 A + B 是非奇异矩阵. 

练习用 （2. 4. 9) 证明 （2. 4. 13), 

练习证明，对任意一对 A ，交换或不可交 换 ）， A 1 d 的各特征值的和 是八的 
各特征值的和加上 R 的各特征值的和. 提示： tr ( AhB ) 是什么？ 

我们 d 考察过可对角化矩阵的 N 时对角化问题，对此，交换性是一个容秘验证的必要充分 
条件，也考察过同时_ .角化间题，对 T 它，交换性是一个充分条件，但不是必要条件.鉴 f 能 
够证明两个巳知矩阵不可同 时二角 化往往是很冇用的，所以，希荜能够找到-个比特征值具有 
可加忡这一条件更强的必要条件.下面的例 f 指出了实现这一条件的途径. 

2. ■*. 14 例设 


/\ = 


loo 
Lo 0 


0 ] _0 0 cr 

11 和 B - i 0 0 

0. Lo 1 0 


-4 和 B 都有二重特征值 0. 它们的任意线性组组合。4丨也是如此，于是，它们的特征值可 
相加，由于这些原因， 似甲有 理由相信4和方是4同时厂角化的.但是，假如有某个非奇异 
矩阵使得 SAS 1 和 SB.S 1 都是上一:角矩阵，那么（8犯 'KSfiS l )=SADS 1 的特征 
倍-定是4和的特征值按某个 顺疗的 乘枳.可是，的特征值的集合是0, 1)，它 


汴不包含在集 {0： ■和集 （0； •的集乘积之中.由此.我们得出结论， A 和 B 是不可同时 上三角 


化的. 


练习证明上例中的个 i 仑断：如果 DtM „ 都 Sf ： 三角矩阵，那么 （ TJ 的特征值是 C 


和 D 的恃征值按某个顺序的乘枳；即 a ( CD ) r ^ o ( C ) o (, D ). 

妗一个不一定是丙相似的间时上一:角化问题「不过要参看 （ 2 . 节] 可以用下面的 McC :0 y 定 
埋来完整地描述，我们略它的 i£ 明. 清回 忆-下曾述及任意多个变元的多项式：它只不过 
是各变元的幂的乘积的-个线性 组合. 如果诸变元是非交换的，那么相冋变元的不同幂 可以与 
其他变元的幂的积相间地出现在某个乘积之中. 


2. 4. 15定理设; A ， 風分别有 [7( A ) ’ （ a 』 ， * …， Of ,,} fll rr ( B ) — , 尾 f ( J •十算 

i 特征值).那么，存在非奇异矩阵 St AT ,,， 使得 YMS 和 s _ 都是 h ： -:角矩阵， 与且仅 
当存在指标 1，2， …， n 的一个排列！，，…， ；', ，便得 B )) = { p ( aj , j ^= 

1，…，幻对两个（非交换)变元的所有复系数多项式 . s ) 成立. ' 

练习' 验训，如果,4 fllil 可同时 H 角化， （2. 4. 15) 中的多项式条件是必要的.证明，如 
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采 A , BGM ,, 可交换，那么 B))~-=\p( a ,, j},) : ./-=!, «}, 对两个变元的所有多 

Wi 项式/>成立.定理 (2. 4. 15) 是如何适用于例 (2. 4. 1*0的？ 

附注定理 （ 2. 4. 15) 的结论对任意域上的矩阵和多项式都能成立，只要这个域包含这 
两个矩阵的各特征值：对于 々二 3, 4. …个矩阵的同时三角化，定理也成立（这时， 

定理的条件要涉及6个变化的多项 式）； 并且，就是对子特扯值的限定予集，定理也 
成立，即；^,, /?. ) e ff Cp ( A . B )), )=1. --•， r 对所有多项式 〆 f ) 成立，当且 
仅当 .4 和 ii 同时各自相似于这样一个分块三角矩阵，在这两个分块三角矩阵的对角 
线上的某些相应位置分別有由…， t 和良，， … ，&组成的 1 X 1 子块. 

习题 

1- 假定 *4, 交换，且分别有特征值〜，…，和仏 ，… ，汉. （ a ) 证明，的 

特征值是 diR • …， ， 其中!_,，■■■，〗„是指标]，…，《的某个排列. （ b ) 如果 

;) 是两个变元的多项式， 证明户 ( A ， B ) 冇特征值氏），…， p(： a „, ^ ). 〔 C ) 最后证明， 
可同时 i : 三角化这个较弱的假设足以得出上述 结论： 交换性不是必要的. " 

2. 如果 ZieM ,,, 证明 A 的秩不小于的非零特征值的个数. 提示： 试证-个上 S 角矩阵 
的秩至少等于非零主对角元的个数，然后利用 Schur 定理 (2.3.]). 用例子 



说明 A 的秩为什么玎能大丁•非零特征值的个数. 

: i . 本题的目的 是要证 明， C ' jiyley - Hamilton 定理对其元素取 Q 交换环而不一定取自复数域 
的矩阵成立.交换环是这样--个代数结构，除了乘法逆元的存在性以外，它满足域的所有公 
理. 因此其“加法”与“乘法”运算是交换的，丑满足通常的结合律和分配律.我们也明确假定在 
该环中存在乘法单位元；即存在元索 “ T 使得对该环中的所有"都有 = 是一个环而不一 
定是域的例子 是乙一 所冇整数对 t 的模.在厶中，“加法”与“乘法”不是通常的运算，但其运 
算结果是对^ 取模： 4是一个域当且权是素数.另…个例子是艮有复系数的*个形式未定 
[ Mj 元的多项式集合. 

( a ) 我们知道， .4 e M „ ,则 adj 是其 r ，_ /元为 A 的 >,; •代数余 f 式的唯一矩阵 

(见 0. S .2). 证明，基本公式 

/\(adj A ) = (atij A )A ^ (dct A) I 

正好是用代数佘子式表 ¥ 的 -4 的行列式的 Laplace 展开式的一个表达式，并且证明，若 A 的任 
意两行或两列相等，则 d«A = 0. 注意到这个公式只涉及乘法和加法而不涉及除法.证明该公 
式对其元素取自任一交换环的矩阵是成立的. 

( b ) 利用 ( a ) 证明 

(f/ — A)[adj(f/ — A)] 二 [adj(// — A)](fJ —A) = det(/i — A)I p A (t)I 

对仟意 A ^ M „， 择至对其元素取 S —个交换环 " Xri 矩阵都成立.证明，矩阵 ad 〆 " — 八）是这 
样一个 矩阵，其元素是次数不超过 „-1 的；的多项式，因而它可以写成 
adj(/7--A) = -f.A, ， r" ，十 … + 力 " 十息， 
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其中系数 矩阵， 其元素是 A 的诸元素的多项式函数.多项式 A ,( f ) 是 A 的特征多项 
式. 

( C ) 证明，若 A M —个其元素取自一个交换环的 „ x « 矩阵，则 
r-I-A^ UJ- 4)(7 广 ： 十也 * : + 

= ( ii _ 

对七二0, ]，2,…都成立.由此得出 

~ A k + (/i A 〉 G/ ； (A ， t) ， k = 0 T 1,2> 

(【 i ) 设户4(/) = ^『+义「/』 + …十〜 + a P = detW — /\)是 A 的特征多项式（其中 a 、= l ) ， 
并且注意到它对其元素取自一个交换环的矩阵也是有定义的.利用 ( c ) 证明 

p'(d = 2 — ^ a b + (tl — A) G“ A “ ） ] 


K 中 


= Pa <^> ^ (il — A ') G { A , r ), 


G ( A ， t ) = J ] a k G k ( A,n 

i =0 

是一个次数不超过 《—1 的 / 的多项式，以矩阵为系数，其兀素是 A 的渚元素的多项式函数. 
现在用 （li) 来证明 

Ai ( A )= pAOJ - (?/ - A ) G (,4,/) 

= (" A ) adj ( f ； - A ) -Ul ~ A ) G ( A , t ) 

= U ! = Q A ( r ), 

其中 H(A ， 2 -彳…而每 f 氏是一个矩阵，其7亡素是与 
;无关的 A 的诸元紊的多项式函数. W 此 QaG ) 是一个具有矩阵系数的次数不超过 n 的/的多 
项 A . 

( e ) i [_ 算 由此得出 p .,( A )^0. 

4‘设 AGAf , 是非奇异方阵.证明任何与 A 可交换的矩阵也与 A 1 可交换.提示 ：利用 
(2. t .4), 然后直接验证. 

用 (2.3. 1) 证明，如果 AGJW „ 有特征值 Al . A ; ，…， A ,,， 那么 
A? tr A* , k = 1 

S . 证明，对 ’ 

「1 0 0 | r-2 1 2 - 

叫 … 和 B 十 - 2 — 】 ， 

lo u 」 L 1 1 1」 

以及对所有纯量 a , be _ C , 有 — M ， 2 a ~2 b , L + iM ， 但是 A 和 H 不能同时相 
似于上 〒角 矩阵. 

7 - 利用 ( 2 . 3 )节习题6中的论据证明例 (2. 4 . 14) 屮的两个矩阵不可能同时上 二角化 .试对 
4题6中两个矩阵作同样的 M 明. 



8. 在证明两个矩阵不西等价时， McCoy 定理 （ Z . 4. 15) 的指异思想可能有用的. '^ LpU , . v ) 
是两个非交换变元的复杂数多项式，乂设 A , /;6 M „ 西等价，即对某个 K 矩阵 
^ A^VBV . 证 明 〆 A , A * )--= VP < M , R ' ) U '. 因此，如果/\和 hi 酉等价，则对毎个丹杳 
两个非交换变元的复多项: ut 夕(/, .()， tr p { A , a * ) = tr pm , tr ). 这与定理 a 2.6) 有什么 
关系？ 

n . 是给定的，且假定 A 和" 没有公共特征值；即 aC / orwe / J ) 是空 

«. 利用(：町1^出111彳1_定理（2.4.2)证明方程/^ Xfi -0, X 6 M 只有解 X = 由此 
得出结论，对每个已知 Ce M „,,„ ，方程 AM X R 二 C : 有唯一解 A 飞 M „„„. 提示： 如果 AX = 
XB -, 用 n 纳法证明，对所冇 A = l ， 2，二， A ^ X ^ XH 1 , 从而对任意多项式 〆 f )， p ( A)X = 
X〆 出. 选取户 ⑴为 -4 的特征多项式便得到九 （ A ) X 二 (J — X 办 （ B ) ■因为二 （ K—ID — 
(B AJ ) … ( B — A „ fh 舛中义,…. A ,, 是 A 的特征多项式，所以矩阵 h (扪是非奇的，因而 
Xp ,{ H )--0 只有零解 X = o . 由齐次方稃解的唯一性■并 R 将 （0. 56和 O 应用 T M „.,„ 上的线性 
变换 X — TCX ) 二 AX — 便可推川，对方程右边仟一已知矩阵 〔:， AX — 的解存在. 

10. 利用习题9给出定理 （2. 4. 8) 的一个证明，要求递推步骤不超过 A — 1 步，提示：把 A 

写成 

.7\]] A [； 

斗 ― 0 义 ：… i _ r^n 1 

' ； ■' r」’ 

_ 0 … 0 .4<J 

其中每个 A „ 是其主对角线上只有夂的上二角矩阵. 



其中 X 与 K 同阶. 证明 


S ] AS =- 


'An 
- 0 


只耑选 X 适合 mrr - -'兄.依次按行做 F 去便可 得出八 相似于 duHg ( A ll 5 鳥 2 ,…， a w ). 


ll.A' ，已知 . 且考虑 换位子 r = AB — BA . 证明 trOO. ^ A-i"° 0 1和8 = 

LI OJ 

G n 说明换位子不必是幂零矩阵；也就是说，即使一个换位子的各特征值的和#定为零， 
它的某些特征值也可以是非零的， ' 

12‘设 A , B 6 M „, C =- AB - BA , [ i 假定 A 与 （； 可交换.证明厂必定是幂零矩阵.试对 
习题11中的例子作出说明. 提示： 为什么存在非奇异矩阵 . S 6/ W „， 使得 SCS _ 1 = diag ( C u , 
〔2” …，^ C , ,其中每个 C „ t M ' 是上二角矩阵，〜〜十…十 ,, t = n , ff ( C „) = i /\,} , 
(i = l , 2, k ), 且 A 4 A ,, (毕 j )? 设 AgdAS 、 ^=SaS 且把 ) 和认一 

) IJ 成 4 C , 的分块对角形式同咽的分块形式.证明 A , (:； C . A ,, 然后用习题9证明，只 
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要 4>1|.1! 为，就冇 .4,-=0. 丁-是每个 C,」tr C, ^0 , 因而 A, ， 0 ; 而走 T] 
时； （ .: 显然是幂零矩阵 . 

13. 采用习题9的记号.利用定理〔2. 1.9) 给出如下*实的另一个证明：若 A 与 B 没有公 
共特征值，则对于毎个 C 6 M ,, 方程 AX —= r 有唯一解.提示：考虑用 TiCSOsAX , 
7' AA ) 二定义的线性变换 T ,. 7':.: M 证明7\与乃可交换，由 （2.4. 9 >推出 T 

的诸特征值是7\和 7', 的诺特征值之差.证明， A 是1 的一个特征值当且仅当存在北零 
M „.„, 使得 / AX — 0,这可以成 i 当 LL 仅当 A 是.4的一个特征值[.考虑 X 的非零列].因此 
乃的特征值的集合与 A 相同，同样， T 』 的特肝值的集合与 B 相同.因而.若 A 与 B 没冇公 
共特征值，则 T 是非奇异的.若 . r 是 A 的相应丁 特征倌 A 的一个特征向以的枏应 
丁特 征值 P 的一个特征向量，考虑 X = x ./, 证明 r ( X)「U f ,)X, 由此得出了的特征值的 
集合由 A 的特征值与 B 的特征值的所有可能差组成. 

设 5=( A 」 ： /6 ACM , 」是一个交换族.证明，下述意义 F 叮以同时上-:角化：其 
中任意一个给定的成员化简为 （2.4. S ) 中的特殊形式，而其他成员化简成共形分块对角上二角 
形乂.即对于每个给定的 .4., £ >'，证明，存 ft . 个非 奇异的 SfM „， 使得对所有的汉兑 A , - 
. S \ jiaf,K Ti r . "IV )S 1 ,其巾，对所有 j =】，2， … ，左， «] + n t I - …以及所有 f '6 
/， 每个 7 TeM „ 是上三角矩阵， rflj 每个 7 7_'的所有主对角兀为夂，若）， ? ， 还有 提 
示： 选定 . s ® 得 S WS 有 （2.4.8) 中的特殊分块对角上一角形式.注意矩阵族彳 S ■ AS ： 

C 是交换的.把毎个 S WS 分成与 S 』.4/的分块形式共形的分块矩阵，然后利用交换性以 
及习题 9 戒 u 的结果(像习题 ia 中那样），证明每个 s 』 A , S 的所冇非对角 子块一 定化为零. 
现在可以*处 丁相应 对角 f 块的 6个族上应用定理 （2. 除了 s ' ts 以外，当然不保证 

^ ! A , S 的一个对角子块的特征值都相等或不问的对角子块有不相交的谱. 

进一步 •阅读和注释 定理 （ 2.4.15) 及 K 推广 是由 N.H.McCoy 证明的，可 参看 N. H. 
McCoy, ''On the Chararti ： ristic- Roots of Msrnx Polyuotnials, "iiu//. Amer, Math. Soc. 12 
(1936), , r »92-600. 也可参 # T. S. Motzkin and O. Taussky, ** Pairs of Matrices with 
Property J,,''Tra?n. Amer, Math. Sot. 73(1352), 108-114 , 其中 H 论了特 征值与线性组 ☆ 
的 关系‘ 一 对 A , B 6： M „ 冇性质是指对所有 a , C 有 + = Ua , 十印，：_/= 

1‘…，"1，而定埋 ( Z . 4. 15) 的条件称为性质 R 显然性质尸蕴涵性质 L , 反之不成立 i 较弱 
的性质1尚未彻底弄清楚，但还是知道一些，例如，一別具冇件质 L 的正规矩阵[见 （ 2. 卩）节] 
一定可交换，因而 定町同 时西对角化. 

2.5 正规矩阵 

正规矩阵是 * 讨论酉等价时 A 然产生的一类矩阵，它在整个矩阵分析中是很重要的，并后 . 
它还推广广丙矩阵，实对称矩阵和 Ilermite 矩阵， 

2 . S . 1定义设矩阵 AeM ,., 如果 /V A 二 AA - ， B | K 如果 A 与它的 Hermhe 伴随可交换，就 
称 A 为正规矩阵. 

练习证明， A 6 M ,, 是正规矩阵 . 当且仅当酉等价十 A 的每-.仑矩阵都是 TH 规矩阵.这 
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说明正规矩阵类在酉等价下是封闭的. 

2.5.2 例 

U) 如果 U 是 K 矩阵，那么因而，所有酉矩阵是正规矩阵. 

( b ) 加果 A ‘= A , 昆然 = W 而，所有 Hermite 矩阵都是正规矩阵. 

<c) 如果 AeM„ 适合/V A, 就称 力是斜 Hennite 矩阵.这时， A* A=-A Z --AA' , 
因而所有斜 Hermhe 矩阵也都是正规矩阵. 

(d)A=[^ ^是正规矩阵，徂它不属 T 上述任一类矩阵. 

练习用元素间的关系给出 M?〔R) 中的正规矩阵的特征.并且按 （2.5. 2a, b 和 C ) 的分类 
作出回答.提示：如果 A£A^(R) 是正规矩阵，证明，如果 A 辛少有一个元素为零，那么或 
或 九 如果 A 的所有元素是非零的，证明， A = A t . 或对某个《>0, AA t 

[lOOl =af. 

练习给出一个 2X2 非正规实矩阵的例子.同时给出一个 2X2 实矩阵的例子，它是正规 
矩阵，但不是对称的，斜对称的或正交的. 

练习证明 （2. 5. 2a, b 和 d 的每一类各 S 在酉等价下是封闭的. 

练习证明， .Hermite 对角矩阵必定是实的，而斜 Hermite 对角矩阵必定是纯虚的. 

2.5.3 定义 如果等价于 - 个对角矩阵，就称 A 是可酋对角化，类似地可定义可正 
交对角化概念.应注意的是，“可西（或正交）对角化”蕴涵可对角化(但反之不成立). 

练习考察 (1.3.7) 的证明便可得出， 冶 fM„ 可西对角化，肖且仅当在 （T 中有一个由 w 
个标准正交向量组成的集合，其中每个向量都是 /i 的特征向量. 

下面，列出关于正规矩阵的最基本的事实.在下述定理屮， （a) 与 （h) 的等价性常常被称为 
正规矩阵的谱定理. * 

2,5.4 定理 如果 A = 有特征值 A 『，…，I,那么下述命题等价： 

(a) A 是正规 矩阵； 


( b ) A 是可酉对角化 矩阵； 

(o 1 1 卜 S u- h 

( d ) 存在由 A 的 7! 个特征向貴组成的 fe 准正交基. 

证明： 由 Schur 定理保证，在该证明中，始终假定丁 = D V .]€ M „ 是酉等价于 A 的上三角 
矩阵；即对某个酉矩阵 U 6 M ,,， 有 T '= CTAU ， 因为丁酉等价于 A , 所以命题 ( a > 等价于 T 的 
正规性.我们将证明， （ a ) 与 ( b ) 等价， （ b ) 与 （ c ) 等价， （ b ) 与 ( d ) 等价，从而完成证明. 

为了证明 ( a ) 蕴涵 （ b )， 需做一些计算.如果 A 是正规矩阵，那么了也是正规矩阵.但一 
个正规的三角矩阵必定是对角矩阵，这只要令 T * 丁和 IT ， 的对角元相等就可以看出来. r * T 
的 U 1元与 TT * 的1, 1元相等表明 

inln = (|]f]i + 么1九 ^ [ (,] r 十公 

?-=2 J =? 


■ 
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这就是说，0二 t ； 丨 ： .若干非负项的和为零，那么它的每一项必须为 0. 由此得出 

j-z 

t)i = 0 ， j = 2,… ， n. 

r * 7' 和丁丁’的2, 2元相等表明 


同理可得 


t-atn = ^22^22 + 2 f? / i s = I hi 1 2 + X ] I b I - ， 

J. = 3 j = i 


li ； = 0 , j = 3 ! ,n. 

假定采用同样的方法已经验证 

f „ =0, ) > ? 和，=1,2,…，公一1 

由此可以得出 

I,, — 0 , j > iy i = k, 

依次 il 论 T ' ：； 和 TT- 的每个对角元，最后得到 

t v = 0 , ) > !'， i = l 7 2.— ,n, 

因为 T 是上三角矩阵，所以又有 

= 0 , _?.<!'， i — 1,2, — ,n. 

因此，证明了 T 是对角矩阵，因而 ( b ) 成立.由于对角矩阵显然是正规矩阵，又酉等价保持正 
规性，所以 （ b ) 也蕴涵 ( a ). 

要证明 （ h ) 与 ( cO 等价，需借助干 (2-2. 2). 闽为任一与 A 酉等价的对角矩阵的对角元是特 
征值 A , ，…， A ,,( 按某个顺序排列）， （2. 2. 2) 使我们从 （ b ) 推出 （ c ). 另一方面，因为; I ;, 

I , 是 T 的对角元(按某个顺序排列），所以， （2. 2. 2) 也表示 

2 u , r = J u , p + s I I 2 * * S - 

! I I 1 

但是 U ) 意味着 


S 丨 ~ ! ! =0. 

或 T 是对角矩阵，由此推出 （ b ) 成立. 

(1>)与（心的等价性，是本定理之前的那个练习所要证明的#实. I ] 

练习如果 reM „ 是〒角矩阵，且 t “ r 与的第 t 个对角元相同，/=1,证 
明了是对角矩阵.说明为什么这个结论连同正规性在酉相似下是不变的结论是正规矩阵可酉 
对角化的基本理由. 

练习证明一个正规钜阵是非亏损的(每个特征值几何重数等于它的代数重数). 

练习证明，如果 A 6 M , 是正规矩阵，那么; rec " 是 A 的相应干特征值 A 的右特征向封， 
当且仅当^■是 A 的相应于 A 的左特征 向量； 即 Ar = A*r 等价于 i + A = A〆 . 撝示：正规化了， 
且记 A = ( XAU ‘， 使^:为 (7 的第1列.那么， A ’ 及各是什么？参看本节后面的习题20中 
的另一个证明. 

练习如果是正规矩阵，且 I 和 j 是相应于不同特征值的特征向量.证明^与^ 
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in *. 提示： 如果 An , Ay ^ f , y , 试证户 〆 ）.' 〆 （ Av ) —( A * W . V =( D*y = ； U ，. v . 如 
果 Aip . 由此得出 . r 、= 0. 参看习题2〗的另一个证明. 

如果巳知 •个汇 规矩阵的各特征值，那么它可以通过下 [ M 理论描述两对角化.确定毎个特 
征空 N . 然后求它的… t 标准止交基（例如，用 Gmm - Schmidt 过程）.因为毎个特征空间的维 
数等于其相应特征值的 ®. 数，乂 A 是屮规矩阵，所以这些基的汴就是整个空间的一个标准正 
交基.把这些向量排威--个酉矩阵的列便得剑所要求的对角化变换. 

下而说明，可交换 的正规 矩阵可同酉对角化. 

2. S.S 定理如果是」 K 规矩阵的交換族，那么 .. f 可 H 时彳 角化； 即存在一个酉相似， 
它把 .1 屮每个矩阵变换成刈角矩阵. 

练习利用 （2.3.3) 以及 [ F _ 规的三角矩阵一定是对角矩阵的事实证明 （2. 「,.5).说明 
(2. 5. 5) 的条件和结沦要比 （1, 3. 19) 的强. 

将 (2 . 5 . 4 > 应用于 珩阵的特殊情形，便得到一个基本结果，常常称之为 Hertmte 
矩阵的谱定理. 

2.5.6 定理如果 A 6 A 1.. 是 Ilemiite 矩阵，邵么 
U ) A 的所有特征值都是实的； 

( b ) A 是可酉对角化的. 

如果 A 云 AC ( R ) 是对称矩阵，那么 A HJ ■实正交对角化. 

证明： 个 Hcrmik 对角矩阵必定氐有实对角元，因而 U ) 可以从 （ b ) 和 Hermite 矩阵的集 
合 /f: 两等价 F 封闭的事实推; I!, 内为 Hermhe 矩阵是 止 规矩阵，所以命题 (b) 可以从 (2. 5. 1) 推 
出.如果 .46^(10 是对称矩阵，那么它就是 Hermite 矩阵，不过，我们注意到.勾角化 A 所 
需一切计算均可在; i : 数域上进行.因为,4的特征值是实数，所以相应的特征向量可以取实向 
域. □ 

在 （ 2. S. .1 ) 和 （ 2. G. fi} 中，特征值相 ㈣ 或不同已尤关紧要了.在 （ 2. 5. 「〕 ） 中+必假定可对角 
化条件.将这些与第 I 章屮 叶对 ft 化的讨论作一比较是有总义的. Hermite 矩阵和 正规 矩阵从 
结构上就保证它 们冇- 1 线性无欠的完备的特征向債组〔实际上是标准正交组），这就是为什么 
它们如此萤要 PHr 如此合意的件质的理由. 

作为结束，我们址:明与 （2.5. 4 〗 和(2. 5. S ) 相光似的定理’它们是关 于实正 规矩阵的.这些 
矩阵是正规矩阵，因此可经 .个 未必是实的酉相似对角化.如果只经一个实正交相似，那么这 
样的丈 TH 规矩阵可能变成的最好形式是怎样 的呢？ 因为-个实正规矩阵可能没有任何实的特征 
值，所以不能保证它可经-个实相似对角化.另一方|0，任一实矩阵可经 -- 个实正交相似变成 
特殊的分块上7角形式 （阽 2. 3.4)，如果这个矩阵还是正规矩阵，就假定它 G 变成这种特殊的 
形乂.证明要利用 （2. 3. ■!). 正像在 （2. 5.4) 中用到了 （ 2.3. 1) —样. 下面的引理可消除一个小 
的技术障碍，它在 （H 1 ) 的证明中+曾出现. 

2. S . 7引理如果 At iW „ 是 Ilermiie 矩阵，且对所有 . rfC % 有那么 A 的所有特 
征值非负.如果还有 trA 二0,那么 A 二 0. 
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证明： 利用 （2.5. ㈦ 可以写出其屮. ] eM „ 是丙矩阵，而 t 1 = 
diag ( A , , A ? , AJ . 于是 A = U ' A [7, 根据假设可知， A , = « t M Wt >0, 从而所有 A *>_0 .最 
后 ， tr A-tr 17 AU ' =tr AU " U-tr A = A , I … + A „， 因此，如果 r r A = 0 和所有 ，就一 
定冇所有 h = 0 .闲而 j 0 R . A-(；Air - [/ OL /* -0, □ 


2.5.8 定理 © AeM„(R), 则 A 是正规矩阵，当且仅当存在一个丈:正交矩阵 QeiW„(10, 
使得 


「 A, 0 


q ! aq = 


e jw, : (h>, 
A t _ 


其中毎个 A, 或者是 IX] 矩阵，或 f 是形如 


.-爲…」 


的 2X2 矩阵. 


1 < yt ^ ^, 


(2. 5.9) 


( 2 , 5 . 10 ) 


证明： 由直接计算可知，每个形如 （£. 5. 10) 的矩阵是正规矩阵 [ A , A /= diag (4+/^, + 

t f : )- AjA ,-\, 因 ifiH 壬个形如 (2. 5. 9) 的直和 也定是 圧规矩阵.由于前面的论断，如果利用 
(L 3. 4) 來证明定理，那只需对形如 （2. 5) 的实正规矩阵来证明就够了.因为在 （2. 3. 5) 屮诸 
主对角子块可以按任意规定的顺序排列，所以可以假定 


是 IH 规矩阵，其中 



A — 


A i2 ■■■ 

… A lt 

A :;:: … A 2i ^ M „{ R ) 


-4 h 


- 

K - 


* 

e m/r) 


10 A,J 

足上 角矩阵- A yl . A u , , A ,；* eM ,, 2 ( R ), 并且对，， hi , 2, 

M 2 ( Rh 卜囬要证明 7? 足对角矩阵， fi 对所有 A „=0. 


(2.5. 11) 


左以及 a ;; e 


l ■匕较恒等式 A T A =/ iA T 中与 （2. 5. 11) 中的子块 K 相对应的第一 fpXf 主对角块元.得 
到恒等式 


R'R - RR 7 \ 儿卜⑴]+ …- 1 A . i - A ,；. (2. 5. 12) 

我们知道，对某个每个形如 fj — 的矩阵 B 6 M ,,( C > 是 Hermit ? 矩阵，且对所有 
e - C 冇性质 .r ' B.r =， 并丨,这样一些矩阵的和也冇冋样的性 
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质.因为， 按一 般的原则， 

tr R T R = \rRR l , 

而且，由 （2.5. 12>有 

tr R r R = ti RR 1 + tr A。, Ai + … + ir A, lt H 

由此可见 

0 = tr A 0 r j 十…十 tr 

根据引理 (2. 5. 7)， 且把上述结论应用于实矩阵6 = 冇 t T A„A〖,>0. 因为它 

们的和是零，所以每一项也是零，因而 A, ^4,1=0, j - 1 , k . 因为 A,,A,{, 的第 r' 个主对角 
元是 A …的第 t 行的 （实）元素的平方和，因此，这些元素必须全为零，从而； V=0, 

2 , k , 且 (2. 5. 12) 简化成 

R T R - RR 1 . 

但是，已经在 (2. S. 4 ) 中证明，一个正规的三角矩阵必定是.对角矩阵，所以有 R-diagU』， …， 
A,), 这正是我们所断言的. 

比较恒等式 AVl=AA T 中与 （2. 5. 11) 中子块 A ，相对应的 2X2 主对角块元，利用对所有 
2 A 有 A v =0 的事实.便得到恒等式 

= An 力?1 + AsA/i + •-•十 A lit Af f . (2.5.13) 

而 trfAAA,)， 像上面那样运用引理 （2. 5.7), 于是，对 j = 2, 3…，I有 
tr(A 13J 4「2) + …+ trCAuA^) = 0, tr(A h Al) > 0, 
tHA ^ At , )^- 0 , A ij A I = 0 和 A l; = 0， 

因此 (2. 5. I 3 ) 简化成 AGAeAnAin 即 2X2 子块 H(E 规矩阵. 

依次验证恒等式力4=力八 7 的与(2.5. 11) 中子块 A,, 相对应的 2X2 主对角块元，其巾;二 
2，3， …， 々一 1，并 R 运用同样的论证，如我们所断言的那样，可以得出，所有非对角子块都 
是零，且所有对角子块都是正规矩阵. 

我们已经证明，一个实正交相似可把一个实正规矩阵化成形式 （2.3. 5>.实际上可化成分 
_块对角形式 (2. 5. 9). 只要证明所有对角子块有形式 (2. 5. 10)，那就完成了整个证明. 

如果 Aw = D ^ AMR) 是正规矩阵，那么’使恒等式 AH=A,Ai, 的1，1元和1，2 
元分别相等便得到恒等式 

V =〆 . 从而=士 6, 

以及 “c 十 W = <a6+«/， 从而，如果(■= — &，则 

Zb{u - d ) = 0. 

f 二十6及& = 0的情形可以排除在外，因为这时必〃将是实对称矩阵’因而只有实特征值；但是 
按我们的作法，子块有一对共轭的非实特征值.因此，只能有二一 /,， a = dt 且4，必有 

形式 (2.5. 10). 由计算可知，实矩阵^ ^有一对共轭的复特征值十 u + ; 7, 和=以一 


ib. 


□ 
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作为这个关于实正规矩阵的定理的推论，容易推导出实矩阵是对称矩阵、斜对称矩阵或正 
交矩阵时的实标准形. 

2,5.14 推论段 A 6 M „( R >. 于是有 

Ca ) A -.4 r , 当且仅当存在…个实正 交矩阵 QeR ( R ), 使得 


Q'AQ 


0 


A„. 


其中所有1 6 R ; 


( b ) A = - A 7 , 当且仅当存在一个实正交矩阵 QGM „( R ), 使得 

「0 


Q r AQ = 


其中每个 AfM 2 ( R ) 有形式 


K.= 


-A 




CO AA T = l, 当且仅当 存在一 个实正交矩阵 Q 6 M ,( R >, 使得 
「 A , 


q ! aq 


0 


A t . 


其中，每个冬=±1,而毎个 A ; 6 Ai z ( tt ) 有形式 
「 cos $ sin^ h 

a J. o,e r. 

L ■- sin^ 

证明：在每一种情形，定理的条件都保证 A 是实正规矩阵，因此 A 可写 成形式 （2. 5.9) 和 
(2.5.10). 如果 A = ,4 t ， 那么每个次 = j 4/, 因而所有找=0,而 <3 T A <5 是对角矩阵.如果 
/\广一 那么 每个; i , = — 七且每个心 = 一4「，因而所有 且所有〜 =0. 如果4^^=/， 

那么每个 A 入=1且每个因而，所有 A 卜] a 所有十戌 =]; 这时有土]且 
Cf^cosdj * 軋 口 

如果有一个由可交换的实正规矩阵组成的族，它们可能不可同时实对角化，佴是可以同时 
把它们都变成分块对角形式 （2. n . 9). 
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2.5.15 定理如果.丨是实正规矩阵的交换族，那么存在实正交矩阵 Q , 使得对所有 
A 6 1， Q T AQ 具冇形式 （2. 5. 9) 和 （2. 3. 10). 

证明：运用（2,3.6)，可经实 1 H 交相似 Q 把，1的毎个成员化成形式 （2.3. 5). (2.3.8) 的证 
明过程说明，它们这时 有形戎 (2. 5.9). □ 

习题 

关于 A 6 M ,, 的与正规性等价的条件，除 f (2. 4) 所列 出的 以外，还可以罗列出吖多.在 

下 面的习 题中， 其屮就 包含若 - r 等价条件. 

1. 证明， AeAf , 是正规矩阵，3且仅与对所打与的 Ewlid 长度相问. 
我们知道 ， （y y ) 1 '是 j & tr 的 Kuclid K 度. 

2. 吐明， iE 规矩阵是两矩阵，当&仅当它的所有特征值有绝对值 1. 

1证明，正规矩阵是 Hermb 矩阵，当 R . 仅当它的所有特征值都是实数. 

4. 证明，正规矩阵是斜 Hermuc 矩阵.当 ti 仅当它的所有特征值都是纯虚数（有等丁 - 0 的 
实部). 

5. 如果 A 6 M ,」 是斜 Hermitc (相应地，矩阵，证明是 H erm itc (相位地，斜 
Hermite ) 矩阵. 

6- W . 明， AeM „ 是正规 矩阵，当且仅当它 4-' 个具有 £异特征值的正规矩阵可交换. 

7. 如同定理 (2. ]. 9) 那样，假定有形式 A = G 'iT ■ 其中是非奇异矩阵. 

( a ) 证明， A 是两矩阵，当 ii 仅当 B 是」丁规矩阵. < b ) 如果 B 有形式 B = 其中， N 是正 

规矩阵，而 H 屉 Hermite 矩阵< 11它们部是非舒异矩阵），证明 -4 相似 f - ■■个两矩阵. 

8. 定义 W A ) : + (_4十 -4' ) 为 /\ 6 JW „ 的 Hermitc 部分，而 S (/\) = | ') 为 .4 的斜 

Hermite 部分， 那么力 A )+ S (.4). 证明 .4 是 it : 规矩阵， H &仅当 A ) 与 S ( A ) 可交换. 

9. 如果两个正规矩阵 " J ■交换，证明它们的乘积是正规矩阵，并用例子说明，即使两个正 
规矩阵不"了交换，它们的乘积也可以是正规矩阵. 

10. 采用习题 fi 的 W 号，证明，如果 fHAi 的每个特征向量是 S ( A ) 的（相应地. A 的 > 特征 
向量，那么 A 足正规矩阵 . 

J 1. 对于任意复数 sfC ：， 证明存在某个 06 R ， 使得一， l 沣意是西矩阵，想 
-想，丙对角矩阵 ueM , 像什么呢？ 

13 -推广习题 n , 证明，如采， i — diiigu !， …， A „) eM „, 那么存作抖对角矩阵 [/, 使得 
A = UA^AU. 

口‘利用习题12证明，矩阵是正规矩阵当 R 仅当存在两矩阵 VGM ,,, 使得 .4 •二 
-4 V . 这与习题7有什么关系？ ' 

l - i . 如果 Aejvr „( R ), 且 a 的所有特征值都是实数，证明， a 是 it 规矩阵，当 fi _ 仅当它是 
对称矩阵. 

丄 5. 证明，两 t 同阶正规矩阵相似（实际上是酉等价）. 当&仅 巧它们存相同的特征多项 
式.这对非 iH 规矩 w 也成立吗？提示： 考察匕 □和 CJ 
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16. 如 HiA ， 是规矩阵，说明未必是正规矩阵.并说明某个阶数的非 舒异正 
规矩阵不构成一个乘法群. fH 是西正规 fe 阵确实构成一个群.非奇异 Hennite 矩阵构成一个乘 
法群吗？ 

17. 如果 AeJW „ 是正规 矩阵，且 〆 f ) 是给定的多项式.用定义 （2. 5. 1) 证明 〆 A ) 是正规 
矩阵. 利用 （2. G . 4) 对这个结果给出另一个 iE 明. 

18. 如果 AeM , 心性质：对菜个非零多项式 〆 f ), P ( A ) 是正规矩阵.那么 A 是正规矩阵 

叫? 提示： 考察 A = ^ ^ A \ 

19. 设 A € M „, 是给定的.证明，/\是止规矩阵，当 R 仅当/\+«/是正规矩阵. 

20. 设 Ae _ M „ 是正规矩阵，并且假定是使 A - r - Ax 的向 M . 试利用习题1和19证 
明 A + jik 提示： 如果向暈 （A — AJ ). r 的 Eurlid 长度是零，试证 (A — AD '. r 的 Euclid 拉度也 
是零. 

21. 利用 （2.5. 4) M : 明，如果是正规矩阵.且 Ar = A . r 和^^ = "3，，其中那 
么/与 . V iH 交.提示：设 A — [ Mf ./、 其中是丙矩阵，而/ I 二 dia S a ， …，； U . 令 
UV = _/ = [./,]*[/_.v — . v ' Lyi 证明4/— A /. R 山此推出对每个使 A , 的指标“有 
/— 0, 同理， /也有炎:似 ft ®. 洱证明 ./ 与;/正交，从 而得出 . r 与 . y 正交. 

22. 利用 （2. 5.6) 证明.即使 Hermitc 矩阵 A 的所有元紊不都是实数，它的特征多项式必 
定冇实系数. 

23. 证明，^ J 和0 ^都是复对称乐阵 ( A ^ Arh 但一个是正规矩阵， 而另… 个则不 

是. W 此，在实对称矩阵和复对称矩阵之问存作着很大的差別 L 见（_1. 4) 节]. 

24- 如果既是^.规 矩阵. 乂是幂零矩阵，证明 .4 = 0. 

25. SA 6 M , 是给定的矩阵.证明， A 是正规矩阵，当3_仅当存在次数节多为 n 1的多 
项式 〆 /)，使得 . V -^( A ). 提示： 如果 ，l = diag ( A ,, …，； L ), 用 Ugnmge 插值法构造个 
多项式 Wf ) 使然 M 引用 （2. 5.4). 这是如何“说明”为什么一个 TF _ 规矩阵与它的伴随 
可交换的？此外，如果 A 是实矩阵，证明使得 A ' 二 〆 A ) 的 Lagrange 插值多项式 〆 ■) 有实系 
数 a , V =/>(—4). 因此对究 IT 规矩阵 A 有 A T = f ( A )，_ H : 中/ >(.) 是实多项式.见 (0.9. 11.4). 

2 S . 给出一个实正规矩阵的 例子， 它丙相似于一个刈角矩阵，但不实 TH 交相似于一个刈角 
矩阵.证明.实矩阵/1实正交相似于一个別角矩阵， ifL 仅当,4是对称矩阵 (A = . V ). 

27.证明，已知矩阵 A 6 M N 是正规矩阵. 仅当对所有.,，， . v 6 C " 有 

( A ；-) 1 ( Ay ) = ( A " j ：) 1 ( A " 3 0. 

从几何上看，这表示对所有 yihC , 与 A . V 之间的夹角等于 /V /与 A *) 之间的 夹角. 
这与 > J 题1是什么关系？ 

2 S . 如果 AeM „ 是 m 规矩阵，证明， A.r = 0, 当 a 仅当 A 々 = () . 这表明71的零空 N 与 
A •的 零空间 相同.考察匕 J 和 D 说明这对一般情形不成立. 
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29. 假定有线性方程组 = 其中，和 jEC " 是已知的，且假定 A 是奇异矩阵. 
所给定的方程组有(非唯 一的) 解.当且仅当对每个使^^^=0的[见 (0. 6. 6)] 有式 ， z = 
0. 可是，如果 A 是正规矩阵，便可证明，所给定的方程组有解，当且仅当对每个使 = 0 
的叹七(："有3，’论=0 ; 即 y 正交干 A 的零空间.如果想求奇异方程组= 的所有解，说明 
为什么在计算上 A 是正规矩阵时的求解比 .4 不是正规矩阵时更简单. 

30. 设卟， 7 i 2 ，… r 叫是给定的 IE 整数，且 A / M 。, ， j = l, 2, k. 证明，直和 A = 
夂©力 2 ①… ㊉ A * 是正规矩阵，当 ft 仪当每个4都是正规矩阵. 

31- i 正明，两个正规矩阵相似，当且仅当它们两等价. 提示： 证明，如果 u 和 v 是两矩 
阵，那么 UAI ； •和酉等价.给出一个例 - f , 说明两个（非正规)矩阵相似，但不两等价. 

犯.如果 A 6 M 3 ( R ) 是实正交矩阵，我们知道， A 要么有一个，要么有二个实特征值.如 
果它有一个 1 E 的行列式，利用（2.5.14)证明它正交等价干[1]6]^与一个平|6]旋转的直和，从 
几何论，可把这 舂作绕 某条经 K 3 中原点的固定轴转动0角的旋转.这是关于力学的 Eul « 
nis 定理的一 部分： 每个刚体运动是一个 f - 移与一个绕某条轴的旋转的合成. 

33. 如果是正规矩阵的交换族，址明存在 Hermiter 矩阵队 使得对 每个人 

都有次数至多为"一 1的多项式九使久 （ U ). 应当指出， •《 对于叉的所有元素是固定 
的，而多项式可能与7的元素有关. 提示： 设176 是同时对角化的每个成员的两矩阵， 
设 /^ LMiag ( i ， 2,…， n)U' , A a =[/ A „ U - , 其屮人 = dia g (Ap , ... ， A ：,"'). 然后取 A ⑴是 
使 1. 2, , n , 的 Ugrange 插值多项式 . 

3 4 . 证明， AGA 1,, 是正规矩阵，当且仅当 A 的每个特征向 M 也是 A . 的一个特征向量.提 
示 ； 设 UeM „ 是两矩阵，它的第1列是 / V ( 因而是 -4*) 的一特征向鼋.检验 UMLT 和 U ' A * t /= 
([/• AL 0 ‘，然后继续做 F 去. 

35. 当 A , iieJW ,, 是正规矩阵时，证明 （2.2. S ) 的下述改进： 4西等价于£{，当 S 仅当 

tr 2, - , «. 提示：利用习题15以及（1， 2) 节习题 12. 

3 6. 设 AeMJR )， 巨假定 A.V = A 7 A ， 因而 A 是实正规矩阵.如果的特征度各不 
相冏，证明 A 必须是对称矩阵.提示：利用定理 (2.5. S). 

2.6 QR 分解和 QR 算法 

为一个给定的矩阵提供一种 Schnr 酉上二角化 （2.3.1) 的特殊计算方法，以及（在 
某些假设下)计算特征值的一个通用的数值方法，称为 QJ ? 算法， Q / e 算法基于一般矩阵 
M 的所谓 QK 分解. 

2>6 * 1 定理 ( QK 分解）如果 AeM „.,„ FI . nh 那么存在有标准正交列的矩阵£36似„,,„和 
角矩阵 使得 A-QR. 如果 那么 Q 是两■矩阵；此外’如果 A 是非奇异矩阵， 
则可以 选取尺 为具冇止对角元的上二角矩阵，并且在这种情形.因 f <3和尺都是唯一的.如 
果 A 6 M _( R ), 那么 Q 和都可以取实矩阵. 

证明 ：如果 A t ，且 rank A = m ，则 A 的各列构成 C " 的一个 X 关组.把 Gram - 
Srlumdt 过程 (U. 6. 4) 应用 j__ A 的各列，用矩阵记婷描述所得结果正是 A 的职分解. G ram - 
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Schmkk 算法的自然推广使 N 样的矩阵记号描述能够应用于 A 的各列可能是相关的一般情形. 
设 A = [ a ，… u „] 写成了以它的 列 +ec" 为子块的分块形式.如果 ai =0, 令 g ,= Cl ; 否则令 
(li =aj(a* )' /2 .对每个 A = 2， 3,…， m， 如同在通常的 Gram-Schmidt 过程中那样，算出 

k- J 

m ;心 一 2 ( 仏 W- 
.•^1 

如果於一 0( 它成立，当且仅当4是 A ，…，!的线性组合），则令士 =0;否 则令仏 = 
yjiy ；. y t y '' 2 . 这时，向量 g,， …， g„ 是正交钽，其中的每个元素或者是单位向量，或者是零 
向量.每个向量 ■/, 是〜，…， a 的线性组合，反过来，上述做法保证每个列 a 是，…， a 
的线性组合.闲此存在纯使得 

— ， _/ = 1，2，…， m. (2, 6, 2) 

*=i 

如果对所有令~=0,而对于所有使 g,=0 的每个；，对所有 ）= 1, 2 1 …，令 r „ = 
0,那么，经过上述过程，上三角矩阵和向量…，如由 ai , ，…， 
'所确定.矩阵 Qeb , ,…，正交列（其中有些可能是零），因而 （2. 6. 2) 表明 
A = QR . 

如果 ran k .4= m ， 则 Q 有标准正交列，因而所要求的分解形式已经得到 .- 特别地，如果 m = 
»,且 A 是非奇异矩阵，那么，根据 (2.1.4 e )， Q 必须是酉矩阵，而非奇异矩阵 ii 二 Q ‘ A 的渚 
对角元必须是非零的.在这种情形，因为要求 i ? 是上三角矩阵，故 9| 是⑷的纯 M 倍数，并且 
对于丨=£，…， n ， </,位于这样.个 -- 维空间内，它在由《,，…， a , 生成的空间中是…，…， 
a , ,生成空间的正交补.因此，除了差一个绝对值为1的比例因于以外，每个&是唯一确定 
的.于是用只 ’= diagC 丨 n , I / m， …，！、 I / r , 謝） K 代替以及用 Q、Q di 叫 （ r _] / | r u | f 
■•+，〜》/ I r ,„ I ) 代替<?，便给出唯一的分解 A - Q ' i ? 7 , 这正是定理的叙述中所断宑的. 

如果 A 的各列不是无关的，取由 Q 的非零列组成的（标准正交)组，然后把它扩允为 C 的 
一个标准正 交基； 用上述方法得来的新向 M 记作现在，用力代替 Q 的第1 
个零列，用 A 代替第2个零列 | 如此做下去，直到所有零列都被这种方式所 取代； 用 Q' 表示 
所得到的矩阵 • 因为 Q' 的新列与況的零行相对应，于是 Q' 有标准正交列，且 QK = Q'i ?, 因此 
A = Q4 是所要求的分解式. 

如果 A 是实矩阵，注意到所有必要的运算都可经实的运算来完成，因而所得到的因子是 
实矩阵. 口 

练习如果 A6M,,』， 且《<^，证明， A 可以分解成 A=LP， 其中， LfM„ 是下三角矩 
阵，而具有标准正 交行； 至 f 其余的论断，这个分解有 _(2. 6.1) 相平行的叙述. 

练习证明，任一个形如 B』A*A 的矩阵(其中都可以写成，其 
中 L6JW,, 是具有非负对角元的 下二角 矩阵.并证明.如杲 A 是非纡异矩阵，那么这个分解是 
唯一的.称这个分解为 B 的 Cholesky 分解；每个正定矩阵都可以按这种方式分解（见第7章). 
提示：写出 A = QK. 

QW 分解有重要的数值意义[例如， （2.6.3)], 然而作为一种理论方法，它同样是有价值 
的.例如，己知矩阵 A6M„ 经酉相似的上二角化，坷以直接从它的通常的相似上三角化得到. 
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如果 S ' AS = T 是上- 二:角矩阵. U 如 （2. 6.1) 中， S - QR , 那么只 1 Q ' AQ 尺=了且 Q * AQ = 
i ? Ti ? 而它 作为上 ：角矩阵的乘积仍是上飞角矩阵.用同样的方式可以推出，有关同时=.角 
化的定理，例如 （2.4. 15)， 劣 际上是同时丙 〖角化 定理.这就是说，如果 M „ 屮的某个矩阵族 
町铃相似同 N =角化.那么它 N 样可经西等价同时-角化. 

h "[ fi . 不加证明地叙述计算特征值的0尺算法.并简要地说明它的某呰特性. 

2.6.3 算法 设 A I : 6 M L 知. 写出 A .- Q ^ R .. 其屮 Q ., 和兄如 （2.6. 1) 所尕，然后定义 
.4,= 尺, 再写出八一站圮，其巾 ft 是酉 矩阵. 而兄是卜角矩阵，这样继续做下太 ■，一 
般地，如果因子/就定义 

练习 i 止明，用 QK 算法得到的每 t 山 M 等价 _ f ' 土 . ^1, 2, 

在某些情形（例如，如果凡的所有特征值有不 IK ] 的绝对伯当时. QK 迭代值 
将收敛 r - 个上三的 矩阵. 因为这个上-角矩阵西等价于 a ， 所以 a 的各特征值便被计算 
出来. 

如果 A , 是实矩阵， Q 尺迭代 fSA ! 吋以通过实的运算来计算.如果 A , ，有非实特征值，那 
么就不能指望 Q /? 迭代俏会收敛十一个 i . -角矩阵.这是 内为这 1'上.:角极限必须是实矩阵. 
' IHI 不过，在某些 情形. 吋以选取迭代值 A t , 使它们收敛于一个具有丨 Xi 和 2 X 2 主对角子坎的 
实分块 h - t 角矩阵.而出现这种情形的允分条件是，除了各个成双成对的非实复共轭特征值有 
相冋的模以外，丄的所冇实特征值都有+同的模.因为分块7角矩阵的各特征值是诸对角子 
块特征信的集合之并，所以 A , 的特征值是作为 Qi? 迭代倌的分块-角极限的 1X1 对角元 
以及诙 极限的 2 X 2 对角子块的特征值 （ 的复共轭对 ） i(ij 出现的，它们可以很容易地用实数运算 
和次公式计算出来. 

2 . 6 . 4 例 下述例 F 说明. Q /? 算法不一定总收敛于一个角矩阵.设 


于是， = ^ I />,特征值没有不同的模.如果 A ,, 二这个算法的一个可能的序列是 



另 一个是 

L[: I-. 

在这两种情形都出现了循环，闶而序列 i / U } 不收敛于上一角矩阵.但是，存在 { AJ 的.个选 
择，它收敛于一个分块上三角矩阵. 
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习题 

1. 设…，^是 C " 中的给定无 X 向 ttm , 且设假定对向 w 

.!■_ . ■•-, r ,„ 实施（0. 6, 4> 中所描述的 Gram - Schmidt 过程得到标准正.交纟 H s:, ，…， iiift Z = 
I I e Ai ,.,,,. ( a ) 对 A — 1 ，2， …， "!， 设 Z 广 …其屮 z s 足经 

(. ram - Schmidt 过程的第 々步 | fij 得到的单位向 . 因而厶= Z . 证明，2, = Xi , , 2,= 
z , i . …， , a „. 其屮，每个 i 都是非奇异上二角矩咗，而么=卜一个除第；列以外其 
余各列金为零的I : - 矩阵.（出设△，… i , k = l , 2 , m . 说明 7) 足上三角矩阵且 
Z ^ XT ,.. k -^ Y , 2, m . '& T ^ T ,„, W 而 Z 二 XT. U) 矩阵 了与定砰（2. fi. 1 H 止明中的 h. 

角矩阵/?之问的相互力系是什么？ （ d ) 证明，对 A + l . k + 2, m , Z , 和了，的前 A 列 
不会变动，_因此， ( rran,-Schmidt H 程的第 * 步就产生最终得到的矩阵 Z 和丁的第々列. 

2. 设 r ; , 是 C “屮给定的线 忭无 关向量组，乂设 X = 考虑下面 
的 算法： 

I . 令2=入， IUi 2 Z =[ m ]. —汗姶先 i 上每列■；.=」.， 卜 1， …， 队 

U . Mk ^ l , 2, m , 实施以卜_代换：_ 

( I ) n 先，列 ■^用 匕& 1 」 代锌； 

C ii ) 对二 A + l ，^ + 2. *■■, m . 毎列; ;， 用 s : 代替. 

我们用 : h 表承 C " 上的择通内积. （ a ) 证明这个过 _ fP 的最后结果是矩阵 Z 标准 

十:交 列，它与习题1中用 GramSrhmidl 过程得到的矩是相问的. （ b ) 若4衷小•该算法在 
第 A 步屮止时矩阵 Z 的存储信息. A --1, 2, m . i 止明厶 一 Xi ,. Z , Z ,„ — 

, A „,； 这里.每 ti , 是一个非窃异上二角矩阵，其形式是丄 一 h —个 除第； 行以外其余各 
行仝为 零的上 _■:角矩阵. U ) 设7«==4> …: x . ^-1. 2. m . 沣意到 T * 足」：角矩阵， 
而 Z t : XT ,. k-U 2, m . 证明每个7' ; 的前 i 列- 1 -」习题]屮矩阵 7', 的舴 A 列足相 N 的， 
即使： V 和乙可能各不相同.设 1—1 二 ( a ) 证明，对 U k - 2. m , Z , 和了，的前 
k 列不会变动，因此该算法的第4步就产生最终得到的矩阼2和 7' 的第4列.这个算法称为修 
改的 Gram Schmidt 过租；它通 过里新 调整 M - 算得到 句 通常的 ( iraiii - Srhmidt 过程相同的结果. 
虽然條改的算法与通常的 Gram Srhmi . lt 算法 仵数学 上足等价的，但记对十数值汁算来说，修 
改的 (； ram-Schmidt jtl 枵更受欢迎 . 因为它需要的存储较少.在 遇到 X 的某些列接近平行这样 
一些难题时，它有助十得到-个能算出的 Z . 这个 Z 的诸列要比用通常的 Oam - Schm ⑷算法 
得到的 Z 史接近十正交.在遇到难题时可以方便地通过列旋转策略使它的性能进 '步改进：在 
实施步骤 11( i :>之前，■&先选作々的是一个余卜的列 j -》 k , 其位度的平方最大.在 
数俏汁算中毎一步（不要求反演）实际上得到 A , 、然后累积这些因子的乘积可以计算 . Y 的 
分解屮 的^角因 f . 

3 . 说明如何用一系列由 Househddor 变换纟 11成的乘积来实现 Q 尺分解.证明上述过程必项 
ffl »】个 Householder 变换来 完成. 且 Q 是这些变换的乘积.一般认力，这 个方法 /十:汁算上 
优于 （2. fi . 1) 证明 中所采用的 C . ram - Schtnidi 算法. 

4. 如果应用于 A ^ iH , 的⑽箅法收敛于一个丄 ..角 矩阵，可以怎样计算 A ( , 的特 邡向量 



呢？ 提示： 需要解 -个 右边也是零的（奇异）三角形方程组. 

5. 设将 Q 尺算法应用于某个矩阵 A € At , 且设 { A ,} 是 QK 迭代值的序列.如果序列收敛， 
且用选择原理 （2. 1.8) 仔细说明为什么£酉等价于 A . 这为什么是電要的9 

进一步阅读关于 Gram - Schmidt 、 修改的 Gram - Schmidt 以及几个其他的正交化过程的另 
外的参考资料和洋细的叙述，可参看 [ GVIJ 的 pp . 146-169. 关于 Qi ? 算法和证明方法，以及 
另外的参考资料可见由 IX Watkins 写的综述，“ Understands ng the QJ ? Algorithm, ,J S/AM 
Rev . 24(1982)； 也可参看 [ Sw ], 427-440* 
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3,0导引 

在什么情形下两个矩阵是相似的？我们知道，相似矩阵有相同的迹、行列式、特征多项式 
和特怔值，然而例子 



说明.两个矩阵的上述四个量可以分別相等， fli 它们却不相似.假如存在某个非奇异矩阵 .56 
M , 使得 A — S£S '-SOS '=0, 那么，因为/\关◦而得出矛盾. 

练习计算 (3. 0.1) 中的两个矩阵的迹，行列式.特征多项式和特征值.证明 7^ = 0. 

因为两个看上去很不相同的矩阵仍然可以相似，所以，一条确定两个矩阵是否相似的途径 
M , 设想有某 t 具有指定形式的“简单”矩阵的集合，然后看这两个已知矩阵是否可以通过相似 
化成这些“简单”形式中的一个.如果它们能做到，那么它们必定是相似的（因为相似关系是传 
递的和对称的）.什么样的“简单”形式能符合这个要求呢？ 

每个复矩阵 A (酉）相似于一个上二角矩阵，它的对角元 ( A 的時征值）可以按任一给定的次 
序 （2.3. 1) 排列，因此，如果两个矩阵相似于问一个上 二 :角矩阵，那么它们就是相似的.不过， 

两个具有相同主对角元和不同的非对角元的上-:角矩阵仍然可以相似.这样一来，如果已经把_ 
两个 G 知矩阵化成两个具有相同主对角元的不相等的二角矩阵，还不能由此得出这两个矩阵不 
相似的结论.这里有相当大的灵 活性； 为了识别是否相似，在一个 h 三角矩阵中有 + 

个非零元(更确叻地说“未必是零”的元）需要考察，这个数目太大了. 关女 这种二角矩阵，没有 
唯一的形式. 

如果说上二角矩阵类与所要求的形式相距甚远，那么对角矩阵类乂如何呢？如果两个巳知 
矩阵中的毎一个都各相似于-个对角矩阵，那么，它们彼此相似，当且仅当两个对角矩阵有相 
同的对角元，其中相重对角元按1数计算而无需考虑它们的顺序.其理 由是： 可以用置相似矩 
阵按任意规定的次序给出对角矩阵 D 的主对角元.&然这解决了讨论上角矩阵时所 
涉及的唯 -ft 问题，然而，现在还有一个存在性问题：不是毎个复矩阵都相似于一个对角 
矩阵. 

练习证明（3.0. 1) 中的矩阵不能对角化.提示：如果泌 ^ SAS — 1 , 那么 A = S . 

如果对每一个矩阵来求一个尽可能接近对角矩阵的上三角形式，而 R 还可用 相似栾 换得到 
它，那么所得结果是 Jordan 标准形，这正是下一节要讨论的内容. 

我们已经考虑过两个矩阵 A ， 的相似性，在矩阵理论中还存在其他有意义的等价 
关系. 例如， A 是否可以经百相似或者只应用初等行和列的变换变成如果 A 和 B 都是实 
矩阵，是否可经一个实相似使 A 相似于6;如果 A 和 B 是 Hermite 矩阵，是否存在一个非奇 
异矩阵 sew ,,， 使得如果 A 和 B 是对称矩阵，是否存在一个非奇异矩阵 sew ,, 
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使得 A 'SfiS'. 

在 L 述每一个例子屮.在一个矩阵集合上有一个等价关系，而我们对 毎两个 矩阵赴 沓在同 
一等价类屮感兴趣，解决这个问题的途径是，求一个具冇规定形式的代表矩阵的“简单”集合， 
它们再取自毎个等价类中的一个矩阵.我们试图把每个 Q 给矩阵化成它们中的一个.如果这 - 
方 法果真凑效，那么每个等价类实际1：必须包含规定形忒的一个代表矩阵（这在相似下对 T 对 
角矩阵集合是卞成立的），而 a 最好在每个类中 K 有--个代表矩阵（或苦设想冇一个山等价类的 
■ i "20| 代灰矩阵组成的较小的且容易描述的集合 ）（ 这作相似下对于 J - 〔角 te 阵集合是 不成、 >. 的）.这 
样一个由代友矩阵组成的集合常常称为标准形，在各章黾， 贾考虑 几个标准形.在后几争的部 
分段落还将引出 K 他标准形. 


3.1 Jordan 标准形：一个证明 


Jordan 标准形是一个“近 f •对角’’矩阵的集合，称为 Jordan 矩阵，它包括对角矩阵. 
Jordan 矩阵具存性质：每个(在相似下的）复方阵的等价类包含一个 Jordan 珩阵，并11按一种 
兄而祕见的方式使得在同个等价类的仟意两个 Jordan 矩阵本质上是相同的.一个与已知矩 
阵相似的 Jordan 矩阵称为该矩阵的 jurdan 标准形 （或者冇时也称为 Jordan 法 式）.只要知道了 
一个矩阵的 j ardan fc 准形，耶么关于该矩阵（即线性变换）的所有线性代数的信息一看就清 
楚 r. 


3. 1. 1定义 Jwcbn 块人 Q ) 是指具冇形状： 


_ 


⑴— '‘ （3.1.2) 

1 

L 0 a _ 

的石 xa 上角矩阵 • 在 h 对角线上有 a .1 项 “ ir ; 纯最 a &上对角线上出现 a 次.其他所 
有元素都是零， IUi ( A )- rA ], 一个 jurdan 矩阵是 igjordan 块的个直和 
I 九 ol 


J , Jh ) 


其中，各阶数 n , 可以相 N ， 而值 A , 末必不 N . 


， + rl ： 


: a )」 


(3, 1. 3) 


应指出的是，如果 (3. I . 3 )中的每个 Jordan 块人 ( AJ 都是一维的.即，所有， i , = l 且々= 
7 i - 那么 Jordan 矩阵 J 是对角矩阵.如果 O . 1. 3) 中 的任一 Jordan 块入 , U ) 有 m>l 那么 J 不 
仅不是对角矩阵，它甚至不能对 角化. 假如人, U ) 二 SAS Ml . J 是对角 矩阵， 那么必须有/! 一 
di 叫 ( A ， A ， …， A )= Af . 丁 是 . MA )— AJ-=&IS 匕 A /'- A / AJ 二 0 r 闲而如果川>]，这种情 




标准形 


87 


形不会出现.相应于每个甲-独的 Jordan 块，都有 J 的一个特征向 M ; 它是属于 ■/中 每个 
J „,( A ) 的第一个对角元的标准基向景. 

本节的主要结果是 t 毎个复矩阵都相似十一个实质上是唯一的 jordari 矩阵.我们将通过 
=步来得到最终的结论. 

第-步 f +: 意到毎个复矩阵相似干一个上〃角矩阵，它的诸特征值按一个规定的 顺序出 现 
在主对角线上；这正是 Kchrur 二角化定理 （2. 3. 1 ), 

第二步然后证明.一个 . K . 二角矩阵可经相似变换成一个分块对角矩阵，其中每个单独的 
对角子块的所有对角元都相等「像 . brdan 坱 (3. 12) —祥 1. 这是定理 (2. 1. S ). 

第-■:步 最后证明，一个其主对角元都相等的上二角矩阵相 似丁若 Tjordan 块 （3.1. 2) 的 
苜和. 

U 要证明了最后■■个结论，就 nl ■以通过复合毎一步所必需的相似变换将任一复矩阵化成 
. Iordan 标准形. 

另外.我们也注意到以 F 事实：如果一个矩阵是实的， ft 仅有实特征值，那么可以用实相 
似把它化成 Jortlmi 标准形.为此，我们想到「（2.3. 1), 那是说，如采实矩阵 .4 只有实特征 
值.那么存在-个实两（实正交)矩阵 U , 使得是 上二角 矩阵，因而它只冇实元素.此外 
(2. 4. S ) 的证明说明，如果上三角矩阵 A 是实的.那么存在一个实相似矩阵 S , 使得 S MS 是 
…个（实）分块对角矩阵，其屮，每个对角子块是上二角矩阵， 目都 具有相等的主对角元.因 
此- 余下只需要证明第步是可以实现的：并||,如果从一个貝.有相同的劣主对角元的实 i : 三 
角矩阵儿姶实施变换，那么.把它化成一个 jordan 块的直和的相似矩阵可以取实矩阵. 

在证 明第二 步是的以实现的过稈中，下述引理是有用的.它的证明其实就是仃接计算. 
3.1.4 引理设 Ol 是巳知的.且假定冇知 rdan 块 

「0 1 0 " 

ii(O) = . . 

1 

_0 0 _ 

那么 

T 「◦ 0 1 

JJ (, C ) J t ( 0 ) - ^ } 」，且如果户^夂则 _/ t (0 K = 0. 

另外， j t ( 0 ) f, r , ^ e , , / — I ， 2 ’ …， k -}, n .[/-( 0 )/*( 0 )] j - = ( j - T f；i ) c ,, 这里， o 
H , 是单位矩阵 ， G 是第个标准单位基向 M . 且 Tfc P . 

现在 证明 ，第步中的简化总是 ri ] ■以做到的.我们知道一个严格上二角矩阵是其主对角线 
h 只有零儿的：:角矩阵.同时注意到 '个具有相等主对角元的上二 角妬阵 是单位矩阵的 一个纯 
M 倍数加上一个严格上〜角矩阵. 

3.1.5 定理设是严格上三角矩阵 .存在 个非奇异矩阵 SeM „ 和整数 N] . ^… 

> 其巾 且 n , …十心=。，使得 


[IW 
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如果 A 足实矩阵，则轵阵 S 也可 以取实 矩阵. 

证明： 如果 A = [0], 结论是明显的.对《作0纳法， H . 假定对阶数小 
严格上 …:角 矩阵，结 论已经 证明.把 A 块分成 


其中 ' ii / i.eH ,是严格上一.角矩阵.根据归纳假设，疗存:非奇异矩阵 agm ,, 
bti 得 s 〉 有所要求的形式 (3. 1. 6); 即 


主意到 J 中没有一个对角 Jmdan 块的阶数超过心，所以，根据引理(3.】. O ， / 1 ' =0, 经简苧 
十算可知： 


/ s := h ; v f ] 与 （:i 1-7)垃右边的分块相一致； sit , a ! ec *> ,且 1 V 然后把 


!在考察这个矩阵的下述相似 矩阵： 

「1 —WU 0110 a! 


(3. 1.9) 
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其屮，用到 r 引理 (3. 1.4) 中的恒等式 （J 现在有两种可能性，这取决于 

^0还是 〜关0- 
如果 尹0 ,那么 


~\!a\ fij 0 

o - 

r° 

(al ei')^ 

i al 

a[e\ 0 0 

0 I 

0 

1° 

A 

0 

0 J 0 

. 0 0 < 

l/a^pj )1.. 

!o 

0 

7. 

- 0 0 /_ 


1<0) 


是一个具有零主对角线的怂 +1 阶 Jordan 块.利用性质） 

「f ^ z a\ 1 f"J e^ul 1 |"J — e 2 a] j r J — Je>aj - 
Lo l 」 L 。 J 」 L 。 J J _ . U 

_ [J e 2 ajjl 

一 Lo j 」， 

然后可以递归地汁算一系列相似的矩阵 


，. 容易证明 


■ r ； e t alr ^r/ - e^alj 1 M 

-U _/ 」U / _T 


f ] 


2 ~ 2 1 3. '■*, 

因为 J ^^ o , 我们看出，在这一系列相似的矩阵中最多经 t 步便可使非对角+块变为零.因 
此得出， A 相似于矩阵 

r °i 

LO J 」 

它正赶 要求的严格上角 jordan 矩阵形式. 

如果 <3?。二0,那么 （3. 说明， A 相似于矩阵 
"0 0 uH 

。 A 。|， 

0 0 /」 

而它乂置换相似于矩阵 



0 

0 


0 al 


根据归纳假设，存在非竒异矩阵 s : eM ,_ Si ， 使得： 


(3. 1. 10) 


_ 
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-0 j J 

是-个 g 冇零主对角线的 Jordan 矩阵.因此，矩阵从而4本身相似于 
. 「八 0 ] 

U j」' 

它就是所耍求的 Jordan 标准形式，只是渚对角 Jordan 块町能不按非增的顺序排列.若有必要. 
经-个分块置换相似便可得到所耍求的形式. 

最 IP . 我们看到，如果 A 是实矩阵，那么在这个证明中所采用的所有相似矩阵都可选为 
实的，十是经 ii -个实 相似. *4 便相似于所要求的 . iorcbm 矩阵. □ 

为建立起] rmhn 标准形，定理 （:L ]. 5 ) 实质上完成 f 所约定的程序的第三步.我们注意 
到，如果 


A * 

A = A 

_0 A _ 

是所有 对角元 都等 f A 的上飞角矩阵，那么， A„=.A 是严格上：.角矩阵.如果 S 6 M ,, 是 
非奇异矩阵，且 S Mrs 是由 （3. 1.5) 所确保的若十个基本人 (0) 的一个卩(和，则 
S l AS'__S Mj - Ui 是苦 f 个基本 Jordan 块^⑴的 紅和. 在 （2. 3) 节中实施的第 -- 步和第一 
步连同第三步恰好 i 正明了 K 述知 rdan 标准形定埋的存在性部分： 

定理设 A 6 M ,, 是 d 知的复矩阵.则存在非奇异矩阵 SeA /„, 使得 
人认） 0 I 

LM..) I 

U . . S ' 1 - SJS \ (3.1. 12 J 

| 0 .f'aj 

且 Hi ! II ： + 如果+计各对角 Jordan 块的排列顺序， A 的 Jordan 矩阵是唯一的•特 

征值 A ,, i -1, 2, k . 不 -定不 相同.如果 -4 是一个仅有实特征值的实矩阵，那么相似矩 
阵 S 5 T 以取实矩阵. 

证明： 除广唯一件外，其余的论断都已证明‘如果 A , SSjH , 相似，则对丁任一纯 MA 6 C 
和讧 意指数”!一_!，2，…，矩阵 M — A /) m 和 A / 广也 相似； 特别地，它们的秩相等 ■ 凶 
此，只 需证 明.位于 . lord 扣 1 妒阵 J 6 M ,, 对角线上的一组知 rdan 块(包括相重的子块）可由有限 
多个整数《^〔7- A / r ' 宂全确定，其中 W =1, 2. AGU ). 

疗先考虑形如的一卜 Jtmlan 块人 ( peAJ * 的情形，其中 " fC 是给定的且 rn ^- l , 
如果//关().则 rank J〆"）" 1 —rank .M 〆 " — '：=込 W 时 rank 乃 （"）"'一 rank _/* (") m 1 = 0. 如果 
0且则 ./ t (0 V " — A (0 r ' 1 =0，因而也有 rank ./ t (0 ：r rankj *(0)"| -1 =0,最后，如 
汜户：-0 fi m < k , 则 rankj t (0) m - rank J , (0)"' 1 -= I . 
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K 次，设_/€/«,,是形如 （3. 1.3) 的 Jordan 矩阵，乂设 AfWJ)， 并目.对于 M = l, 2，…， 

定义 ^(^ Eranka — A / r ; 且令 r ,, U ) m . 从前述关 T _ 一个子块情形的分析可知， 
r ,,‘ M ) . r m ( A ) 等十 J 屮所有阶数 A 的诸 Jordan 块 A U ) 的总数， FI . 对所冇^>«冇 
之⑴ = 0. 凶此，/屮恰好是阶数 A = m 的诸 Jordan 块的个数等 n ( A )— UA ) = r ,„ , U )- 
2 r „ ( A ) + r „ . [ ( A ) ，其中 m = 1 ， 2 ，…，，!， □ 

练习设 AeM „ 有 Jordan 标准形设 A 是 A 的一个特征值，其代数重数为 v , 又设心 
表示 ./ 中阶数为々的诸 Jordan 块 AU ) 的个数，其屮 A — 1，…，如果当 时〜 U )= 
rank(,A A /)™. [ ft | r ,( A ) = ri , ilH 明 i 

(a) r„,U) 和&满足线性方稈组 

r ,„ (A) — « — y + 2 d ~ fn ) b t , m — 0,1 — 1. 

(b) 该方程组有唯一解 .（c) 其解为 k= r „, [(A) 2r,„(A) + r„, 4! CA), m = l, 2,…，〃 ， 具： 

'I' r ,,.. [ (A) = r„ (A) 

为了有扎 rdan 标准形的一个标准表示 （3. 1.2), 我们约定选取 A 的各不相同的特征值 A, ， 

A.. …. A* 的某个顺序.并 fie ■宄给出相应 于1 的所有 Jordan 块： 然后是相应于的那些 
Jordan 块，如此等等.相应于每个不同特征值的诸 Jordan 块，按递减（非增）的顺序给出，疗 
先是最大的 /" •块，随后是仅次于最大的子块，等等.因为，相应于同一特征值的多重同阶子块 
是完全相问的，所以， - 旦给定了诸特征值的顺序，这个表示就给出 T 个唯一确定的 Jordan 
标准形 .M„ 中的矩阵的每个相似等价类包含一个II只包含一个这样的 Jordan 标准形. 

虽然推导 Jorhn 标准形的过程是一个明确的算法.它原则上可以用来计算-•个已知矩阵 
的 Jordfm 标准形，但是绝对不能指望 用计算 机对它自动实施数值计算.令人遗憾的事实是， 

使用计算机不仅可能得川虚假的结果，而且实际」 :并 没有一个计算 hnhn 标准形的稳定的数 
值方法.这只要举-•个简单的例子就清楚 r. 

如果 A, = G =， 11 e ^°- 那么 丄 S s — 1，其屮 = G II. i s -[° °].如果令 

e— 0,那么， ； e -[° ifli 它不可 能是非 零矩阵戍=^ □的 Jmfcm 标准形 .^ L, A,, 有 

[° U 作为它的 Jordan 标准形.丙为一个矩阵的 Jordan 形未必是该矩阵的各7[素的一个连续凼 

数.町能有这种情形，一个矩阵的各元的个小的变化会引起 kretan 标准形的各元的一个大的变_ 
化-小能指望用稳定的方法计算这样的对象.因此在数值应用中，儿乎没有用到 Jordan 标准形. 

尽管有这样的 M 限性， Jordan 标准形还足值得认真了解的.它为透彻理解矩阵提供 T 丰富 
的源泉 • 作为 -般的 技巧，当我们要证明矩阵的有乂结论时.不妨先考虑能否对对角矩阵证明 
这一结论.如果这是可行的，那么就(利用任一复矩阵可以用.个可对角化的矩阵任意接近的 
事实）看…看某个极限论 i£ 是否可以一 般地证 明该结论.如果这不见效，或者想避开分析论 ill: , 

那么 下一步便可设法对上-.角矩阵或 Jordan 矩阵来证明这一结论. 

每个矩阵都相似于形如 （ 3 . L. m 那样的矩阵，其屮，诸 Jordan 块中的所有项 “..t 丨”都用 
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£ 关0代替， s 可以取任意小的值.了解这一点有时是有用的. 


m 


3.1.13 推论设是给定的复矩阵，乂设 E >0 是已知的.那么存在一个非奇异矩阵 S = 
s ( e ) eM „, 使得 

1八（义”^ ) 0 1 


A - S 




m (3. i . ⑷ 




且 



0" 

eAC 


L 0 J 

如杲 A 是只具有实特征值的实矩阵，那么 S 可以取实矩阵. 

证明： 首先求非奇异矩阵&6似„，使得是 Jordan 标准形（如果 A 是实的 ， &R 
有实特征值，那么取实 &). 然后取 D E = di ag ( l , e , …， c "- 1 ), 再计算 D , '( S ^ ASJD ,. 
这个矩阵具有形状 （3. 1. U ), 于是 s = S(d = & D , 符合定理的要求. □ 


习题 


1. 用详细的计算来证明引理 (3. 1.4). 

2. 试用 U . 1.11) 的证明中的 ...: t 步骤，求 

[I 和段 

Jordan 标准形. 


3. 设是复矩阵，但只有实特征值.证明 A 相似于一个实矩阵，相似矩阵可以选取 
实矩阵吗？ 


进一步阅读定理 （ 3 . 1. 11 ；|的证明思想取自 K . Fletcher and D . Sorensen , ‘‘ An 
Algorithmic Derivation ol the Jordan Canonical Vorm ,'' Amer . Math . Monthly 90 ( 1983 ), 12- 
is ， 文中另有参考文献. [s te ] 从数值计算的观点讨论了 j ordan 标准形，并 a 给出了例子说明 
矩阵的元素产生扰动时其 Jordan 标准形的灵敏度. [ Str ] 提供了一个好的证明. 


3.2 Jordan 标 准形： 若干论断和应用 

3 . 1 Jordan 矩阵的结构 Jordan 矩阵 

V, L (Ai) 0 

卜 

'. 0 J, I( CA*) 
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有一个确定的结构，它使得该矩阵以及与其相似的仟 一矩阵 的某些基本性质变得更加明 M. 

1. Jordan 块的个数 M 相同的子块计1：复出现的次数)是 J 的线性无X特征值向姑的个数. 

2. 矩阵 J 可对角化，当且仅当6 = & 

3. 相应于一 t 已知特征值的 Jordan 块的个数是该特征值的几何重数.它是相应的特征空 
间的维数.相应于一个已知特征值的所冇 Jordan 块的阶数之和是该特征值的代数重数. 

4. 知道了诸特征值以及它们的代数重数和几何重数，一般不能完全确定一个 Jordan 矩阵. 
我们还需知道相应于每个特征值的各」 cmkn 块的阶数，相应十一个特征值 A 的最大 jonkn 块 
的阶数是 A 作为其极小多项式的一个根的重数 (3. 3. 6). 

5. 相应于某个特征值的诸 jordan 块的阶数可以通过计算某些幂的秩来确定.例如，如果 

■210； - 
0 2 1： 0 
0 0 2: 


0 ：0 2 


紿计算 



U 0 
0 0 
0 0 

(j-2h s = 


0 ； 

1 : 

0 ' 

■ 0 1 

: 0 0 

0 


0 1: 

0 

0 0 



0 


0 : 

0 

0 1] 


, U 0 



0 0 

0 

0 0 ■ 


國 


和 （J 2J)'—0. 因此，我们知道 


圆 
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( j - 2 ir = 0 ， 

— 2 J ) 2 二 1， 
ranker — 21 ) 4 , 

是 SXS 矩阵. 

这组数足以确定 J 的分块结构.事实上 ， （J _-2/ V 二0说明最大子块的阶是 3. (J — 2 I ) 2 的秩 
就是3阶子块的个数，内而只有一个3阶子块.（.厂_2〖）的秩是3阶子块的个数的2倍加 h 2 
阶子块的个数，因而有两个2阶子块 .. 1阶 . f 块的个数是 8—(2 X 2) — 3 =〗.可以把同样的手 
续应用于具存任息阶数的若十】 ordan 块的直和，只要它们是相玷于 N —个特征值的所有子块. 
如果•/是相应子特征值 A 的这祥一个直和，那么使=0的最小整数*,便是最大子块 
的阶数. ( J - A 7)*' 1 的秩是 h 阶子块的个数， <；- A /}*= 2 的秩是 h 阶子块的个数的2倍冉加 
上1阶子块的个数，如此等等.对丁 . ; 一0，1，2 ,…， t 1， （ J — 的秩序列递归 
地确定出 J 中所有 _ f _ 块的阶数. 

6. 在一般的 Jordan 矩阵 （3. 1. 1. 1 〉 中的所有 Jordan 子块的阶数可以通过分析某些幂的秩 
来确定.如果是 jurdrm 矩阵的特征值，那么.当我们取幂 （_/ _ AW ). 

…时，只有相应子 A , 的诸 Jordan 块会变成零.因为 J - A , 〗中的其他子块都有非零对角元‘最 
终 ， U A ,/)* 的秩将停土下降（不必考察仟 一 々>„) ; 使 （J -七的秩达到它的极小偵的那 
个最小的々值是相应于; U 的最大子块的阶.这个极小值称为特征值 A , 的指标.对 （_/ - AJ ) 的 
各次幂组成的序列的秩进行分析，就足以确定相应丁 1的诸 jOTdan 块的阶数与个数，然后冉 
对1， A 3 , 等等作同样的分析，因 [ fii 确定出所有的子垅 . 

虽然上述各个论断是针对 Jordan 矩阵 J 作出的，然而.每一个论断也 同样 适用子任一相 
_似于 J 的矩阵. W 此，如果巳知矩阵 ACM ,,， 那么，4的 Jorcbn 标准形（而不是把 A 变换成 
Jonhm 标准形的相似）可以通过下述步骤来确定： 

1，求出 .4 的所有不同的特征值，或许这可以通过求特征多项式的根来办到. 

2. 对 A 的毎个不同的特征值 A ,， 作 ( A — A 」/)\ 其中々一1. 2 ，然 iTi 分析这些矩阵 
的秩所组成的序列便可看出 A 的相应于特征值夂的所有 Jordan 块的阶数与个数. 

这个算法对 j 1 手算一些简单形式的小矩阵可能是冇用的，但是用计算机计算就可能失效， 

因为确定-个炻阵的秩的过程本来就是一个不稳定的过程.例如， A e - ^ 就町以使我们 

看清这 一点； 对所有 A s —有秩 2 . 似对 f = 它冇秩 1. 

例如，这个算法在下述情形是有用的.假定有这样一个问题，要确定知 rckn 块人（0)6 
的平方的 Jordan 标准形： 

[0 0 1 0 ~ 

「oi or : 


A 二 
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/\的各特征值都是零，对"，.-十 D /2] 二 U 丄 1)/2 的整数部分， A ™=0， 而如果夕=_1，2.…， 
m — L 则^^#0.对丁_户一1，2《 2 , 每个幂的秩比它的前一个幂 A * ■的秩少 2. 

如果* 是偶数，则 A _' : 為秩 2. 时如果6为奇数，刚有秩 1. 因此，.4 = _^(0)的 Jordan 
标准形是 

r ° 1，*:2阳是 偶数； 

0 1 

| ， k — 2 m — 1是奇数. 

丨 （0) 」 

这•结果对于确定一个 C 知矩阵是否冇平-方根是有用的.比如，它说明不存在使 A 2 — 
厂0 11 

[ ()( 」的矩阵 

3-2.2 常系数线性微分方程组在理论上 II 冇要意义的 Jordan 标准形的一个 应用进 分析常 
系数微分方程绀的解.设知的.且考虑一阶初值问题 
. i '( t ) Ai . ( t ) ‘ 

= a 是已知的， （ X 2. 2. 1) 

K 中八 r ) = [. nG )， 心 （/)..■•， r , 艮撇号 （'） 表 4 对 f 微分.如果 -4 不是对角矩阵，则 
这个方程组是耦合的；即 r , ⑴不仅与 . rA ) 冇关.而 a 还与向'⑴的其他分 fl 有关.这种耦 
合情形使 问题变 得难以解决，11是，如果可以把变成对角〔或近乎对角）的肜式，那么耦合 
的影响可以减弱，或# 其全 " J ■以消除，因而可以很容易地求解.如果 <4=^75 其中 .1 是 A 
的 Jordan 标准形，耶么 （ X 2. 2. 1) 变成 

: /( f ) — Jy ( i ), 

. v (0)— 氕是 Li 知的， （3. £. 2-£) 

其屮 . r (/) = s . v ( f )， 且如果可以解出问题 （3. 2. 2.2), 那么 （: H 2.1) 的解的每个 
分 M 就趙 a 2. 2. 2) 的解的诸分量的一个线件组合，且这个线性组合是由 S 给出的. 

如果 A 是可对角化的，那么 J 是对角矩阵.且 （3. 2. 2. 2) 正好是一 f •形如 ./*(()=- X iyi ( t ) 
的非耦合力 程组， 它有解 — 乂 （0 VV . 如果特征值心是实的，这是一个简单的幂，而如 
果 Ai = tt t 丨办是复数，它则是一个振动项: M /) =; y *(0) t *" t '「 cosC ^ f ) + 乂11(/) 〆 )」. 

如果 J 是非对角的，解就更复杂了. 相故于 _/中的不同 Jordan 块的 y ( f ) 的诸分量是非_ 
合的.因此只要考虑 J 是单独的 Jordan 块 

^ 1 0 " 

J = . 1 6 M ,„ 

.. 1 

0 A _ 

的情形就 M 丁以广方程组 （m 2) 是 


-JJ0) 

- 0 

以及 

: JJ0) 

- 0 J 
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( f )= 心丨⑴+ y 2 ⑴, 
h (t)= Ay,„_】 ⑴ +y m (t)， 

y 、 ⑴亡 Ay 奶 （ t )， 

它可以由下往上直接求解.从最后一个方程开始，得到 


于是 

它有解 


y ^( 0 ) e ^ , 

乂 ] ⑴= Xy rir .i(t) \ y M (0)e^, 


: iU) = 3^(0)M 十 (0)〆， 

于是 可以把它用于卜_ * 个方程，它变成 

y:-.y (0 ^ A.v„. 々（，）十：^, ( 0 ) /一十』 （ 0 ) 〆 ■ 


它有解 


3V L>(f) = X«(0) 十 』（0)〆 十 . v ,,.〆()），， 
如此等等.显然解的每一个分 M 具有形式 


yM 、 了 4⑴， 

其中是次数至多为；/ ( -1的多项式， 

从上述分析可以知道，对于任一给定的初始条件々，问题 (3.2. 2. 1) 的解 T(f) 的各个分量 
有形式 


‘r,Q) = 十九 U) 广， -u …卜 p k {t)e^ T , 

其中 Am 心•…， Ai 是 A 的不同的特 征值， 而每个 A ⑴是多项式，它的次数严格小于相应予1 
的最大 jordan 块的阶数.实特征值产生纯指数项，而复特征值可以产牛混合指数和振动项. 


3. 2‘3矩阵与它的转置的相似性每个 Jordan 块置换相似十它的转置，因为从相似性可以看出 



"0 r 

A 1 0 

—o r 


"A 0" 

1 

_ i 

1 

J o. 

1 

0 A 

，’。」 

1 

0 1 A_ 


因此.如果 AeM ,」 是已知的， fl A = SJS 1 是它的 Jordan 标准形，那么 ./\ 相似于 _/ ，而 _ 
相似于 . 广乂相似 1 厂（夕） . 结论是，每个复矩阵相似亍它的转置.由此推 
出，一个复矩阵的行秩（线性无关行的最大个数）等于它的列秩（线性无关列的最大 个数） ，这是 
w 为秩是柑似不变童 . 同时也推出，和 /r 有相同的特 怔值 ‘ 不过，苜接作出所冇这 ft 推论 
也是比较容 M 的 . 

对任意的域 F, 情形也是这样， M,,(F} 中的毎个矩阵都可经 JV/„ ( F! 中的一个矩阵相似于它 
的 转置； U 不必假实际丄，相似姖阵可以取为对称矩阵. 
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3.2.4 交 换矩阵和非减次矩阵 如果 〆 是多项式，而是已知矩阵，显然 〆 A ) 与 A 
可交换，这是一个冇用的事实.可是反过来又如何呢？如果 A ， 是已知的， i _ A 与 B 
时交换. B 必定是关千 A 的多项式吗？当然不是这样. W 为如果取 4 = J , 则4与每个矩阵都 
可交换， p (/)= f ( l )〗 不可能产生任何非纯 M 矩阵.问题是 Z 这一形式使它能与许多矩阵可交 
换， 佴又只 允许它产生少数形如的矩阵，为了得到这方面的仟何结果，必须寻求协岡这 
两种能力之间的关系的某个折中办法. 


3. 2. 4.1 定义 矩阵 A6M ,, 叫做非减次矩阵，是指 A 的每个特征值有儿何重数 1 . 

因为 Jordan 矩阵的一个特征值的几何重数等于相应干诙特征值的 Jordan 块的个数，所以， 

一个矩阵是 f 减次的，当仅当相应于毎个不同的特征值恰好有一个块.例如，如果 
A6M ,, 有 h 个不 N 的特征值，或者 A 只冇 -- 个特征值.而该特征值有几何重数】，那么它是 
非减次的.纯 fl 矩阵小是非减次矩阵. 

3. 2. 4. 2定理 设是给定的非减次矩阵.矩阵与力可交换，当且仅当# 在个 
次数至多为 n _ 1 的多项式使得 B 二 />( A ). 

证明： 如果 B = 那么 B -定与 B 可交换. 又于逆 命题，设 A = SAS ^ 是 A 的 

Jordan 标准形.如果那么 1 二 SJS — I 且 dS )/:』 如果能够 
证明 S 'BS = p ( J ). 那么 U — Sp ⑴二 〆 SJS — 4 因此，只要假定 A 本身就是一國 

个 Jorckn 矩阵就可以了.因为 .4 是非减次的，所以可以假定 

「 V A i) 0 1 


I 0 '⑹」 

其中 A ,， A .， …. A t 是 A 的 A 个不同的特征值，如果把 / T 写成与 .4 的 L 述形式相 N 的分块形 
式 S = 那么 AB - BA 的相应非对角子块具有形式 

九 a) 札 一 bj„,(v = 0, i -/■ 

因为特怔值 A , 和 A , 是不同的，由此可以得出[^(2.4> 节习题 9], 札- 0是这些方程的唯解， 
W 此矩阵 B 必须是分块对角矩阵 

0| 


L 0 &」 

艽中毎个技 eM ,,,. 交换性假设是说，对于所有 i = l ， 2.…， A , 有 二人 如 
果记 二 aj + n ,, 其屮 


N .- 


0 


0 " 


G M ,, ; 
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那么这些怛等式变成 .' = 1, 2, k. 直接计算町知，由于 /V ■的特殊形式每个 
B , 必须是具有 Toeplitz 形式 (0. 9. 7) 的上三角矩阵.即 

b \" br ^； 1 " 

B , = , (3. 2. 4, 3) 

0 '.吣 ' 

_ 的 

其中沿#各对角线的诸元素取常值.如果可以构造出一些次数窄多是 《 -1 的多项式 A ( f )， 且 
136；具有性质：对所有声 j , />」（人,（\))=0而 a (人, a ))= u ,, 那么 
pit) = 九 （ f) .1- p k (t) 

将满足定理的论断.定义 

g ,( f )= JX(f _ A ; ⑴的 次数： n -- 丨， 

,1 

户 

由此可见，对所冇！»有1(入/义,））一0,这是 W 为 （人 / A ,) A , 7 )"，=(). 显然 / A ,)) 不 
•定 等丁可是它是非*异矩阵（因为是各不相同的）， H , 像关于九/1)的任^个多项 
式那样，具冇形式 (3. 2.4.3). 

因为形如 (3. 2. 4. 3) 的仟一非奇异矩阵的逆具有 N — 形式，乂因为这种形式的任意两个矩 
阵的乘积还是这 N —形式，所以矩阵 

a)) 」 'h, 

是员冇 Toeplitz 形式 （ 3. 2. 1. 3 ) 的上三角矩阵，每个这样的矩阵可以写成关干 J„ (A. ) 的一个多 
项式.例如 

a — 杧|(八 a)—mm 八 a ) - x , iy - 

因此.存在一个次数至多是 / v - l 的多项式 r ( f )， 使得 

^AJ)] l B, = r, (J„ CA,))■ 

如果现在令 PM )= H ⑴ n ⑴,/ >,(/) 的次数罕多是 N - 1. 

/ ( AJ ) — 9 ，(；, r / A ,)) r ,( i „ j CA J )) = Or / i ^ Q ,-)) = 0, 

如果 则 />」（./„ ii a >〕一 g 「 tJ ,, i U ,)) r ,( h .( A ,)) = B 「. □ 

定理的逆命题也同样成因而导出非减次矩阵的…个特征：矩阵是非减次的， 
当 tl 仅当每个 -M A 可交换的矩阵是 A 的一个多项式. 

3.2.5 收敛矩阵 矩阵 A 6 M . 如果冇具件质：当,„—…时，的所有元素都趋干零，就称 A 
为收敛矩阵.这样的矩阵在数值线件代数的算法分析中起着甫要的作用.如果 A 是对角矩阵， 
那么显然有： A 收敛，当且仅当 A 的所有特征值的模都严格小于1，并 a 同样的结果可以推广 
到可刈角化姖阵. 

由于涉及极限运算，如何运用扰动理论 把这一 结果推广到未必是对角化矩阵的一般情形是 
_ 不明显的. fli 是，可以利用 Jordan 标准形，如果 A 二, SJS g A 的 Jordan 标准形，那么， V '= 
SJ-S 因 [ fl 卜当时 A ™ — 0尚&仅当 m ，⑴时 r — 0. 因为_/是诸 Jordan 块的 苴和， 
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所以只要考虑 Jordan 块 



A 1 

0 


A 

Q - 


'[) 1 0 

( A 卜 

_0 

... 1 

AJ 


0 

A 

十 

1 

0 01 


= A/ 1 JVj t ,其中 /V t =人（0) 

的各次幂的性质就可以了.因为，对所有 \m 

ry.fA)]" 1 = (A/H - S(7 )aw '= 客 ( m )n 

对 所有的 ，《>々成立，因为各对角元都为 A™, 如果 V—0, 则必定有 A™— 0,这说明 U I <1. 
反过来，如果 U | -< 1 . 我们想证明，对每个 j = 0, 1, 2,…， A 1, 


然而， 


当坊一 ► 〜时， 



I m ' 

匕 -> 


2卜士 
j:u r — 


r ^_ 

T\ 


I 

U 7 !' 


w 此，只要 i 正明当时有 m 'u o 就够 r . 看出这个关系的一个简单办法是取对数， 
并 LL 注意到，因为 log | A | <0 ， 乂根据 l/Hopital 法则，3 x m 时 （ logj. Vjt—O ，所以当 


jlogm I mlog I A I -►— 

上述证法主要是利用 A 的 Jordan 砧准形来证明，当时有 A'"-*0. 当且仅当 A 的所 
有特征值冇小 T 1 的模.另-个证明将在 （ S . 6. 12) 屮给出，它根本不依赖 Jordan 标准形. 

3.2.6 几何重数-代数重数不等式矩阵 A 6 M ,, 的一个特征值的儿何重数是 A 的相应于豉特 
征值的 Jmdm 块的个数.这个数小于或等千相应于该特征值的所有 Jonkn 块的阶数的和.这 
个和是代数重数.因此一个特征值的几何重数不大于它的代数1 数； 试与 （1.4.9) 比较. 

3.2.7 可对角化矩阵和幂零矩阵 一个矩阵是幂零的，是指对某个 fK 整数 h 有 A *^0. 
扛一 Jordan 块 A ( A ) 可以写成 ./,( A )= W + JV ,， 其中， ( N t )*= 0 . 因此， 仃一 Jordan 块是 -. 个 
对角矩阵矩与一个幂零矩阵的和. 

更一般地，一个 Jordaii 矩阵 (3.2. ].1)可以写成 J = D +/ V , 其中〖）是对角矩阵，它的主 
对角线与 J 的主对角线相同 ， HN = J ~ D . 矩阵 W 是幂零的，且只要+是 J 的最大知 Han 块 
的阶，就有 JV = 0. 

最后，如果 AGiVi , 是任-给定的矩阵， 1 L A = SJS — 1 是 jcjftkn 标准形，那么.4 =切5 ' 
+ SNS 其中可对角化， / U . 是幂零的 ， FL A D A^=Ar,A D , 这是因为 P 和 AT 

都进具有相应的同阶子块的分块对角矩阵，且 D 的渚子块是纯 M 矩阵. 

我们得出，任一可以表小_成一个可对角化矩阵与.个幂零矩阵的和’ 口.这两 t 被 
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加矩阵可交换. 

习题 

L 设^；/\„ ； 足•给定的矩阵族.且附以指标集/, 乂假定存在非减次矩阵 

-4,6 MS 得对所冇斤乂有 H 二 / W 证明，对每个都存在一个次数辛:多为 H J 
的多项式 p a u ) 使得八 一 a ( 人 ） ， a 而^_是一个交换族. 

2. 设 .4 eK 是已知的. A , 是 A 的一个特征值.证明 A 的相应特征值 A , 的最人知 r Han 
块的阶数 U , 的指标）是使 nmk ( A 九〗）* = ^以(.4一 A ,/ 产"的义二扒2, .... »- 1的最小值. 

3. 如果对某个 f > n ， 有/^― 0. 证明，对某冇#;-0，因此毎个幂零矩 
阵冇-个次数不大于其阶数的等 -r 零的幂. 提示： 证明0是 A 仅有的特征值.想一想 A 的 
Jordan 标准形是什么样子 v 再取幂. 

1. 设人（0> 是一个已知的 Jordan 块.试利用 （ 3. 2. 〗 ） 末尾的证法确定矩阵 j ( 0 ) 的三种可 
能的 Jordan 标准形， 

5. 设 - AeM ,, 是幂零矩阵， ㈨ 而对某个々有 ， V =0. 证明， A 的特征多项式是/^(/)=广 
作用在次数全:多为3的全体多项式所组成的向量空间匕的线性变換 pit)--p'(t), 
/+：* J ={|, t . v . f 八下有基表示 

-oi o tn 

0 0 2 0 ' 

0 0 0 3 j ' 

—0 0 0 0」 

这个矩阵的标准形是什么？ 

7 . 使 J 的矩阵 A 6 M 的各种可能的 Jordan 形是什么？ 

8. 凡有 特征多项式/ >,( f ) = (; 十的矩阵的各种可能的 Jonian 标准形是 
什么 ■? 

9. 试用 （3. 2.1) 中所叙述的方法确定 



的 Jordan 标准形. 

10. 忒证定理 (3. 2. 4 . 2> 的证明中的论断：形加 ( m 3) 的两个矩阵的乘积有同-形式•冉 
证明一个形如 (3. H 1的非奇异矩阵的逆有同一形式.提示： A 的逆是一个关于 A 的多项式. 

11. 设 A. EG_M„, 试用定理 （ 1. 3 .M) 的证明中的_等式证明， 汽 / J 和的 J 0 rd ⑽形中 
的各非奇异 f 块是恒等的.这能说明 AS 与 B .4 相似吗？如果 AS 与 BA 不相似，讨论这与它 
们能够相似有多大差別. 

12. 假定 A ” …， A * 是已知矩阵，其中， A , tM „ , j-1, 2, k, 又假定 J " .. ■，人 
是它们的相应 Jordan 标准形.证 明古和 




0 _ 

6 ， m \-n- t -\ - - [ n,. — n 

A t _ 





(除/差诸对角子块的一个排列以外>有 Jordan 标准形 

ri. 01 - 

! ^ I 

0 ‘*. r 

i . ；j - 

13. 设 AeM ,, 和 H ， C ’ eM „, 是巳知的.证明，直和 (] >吣 | -„ : 相似于直和0 °1, 

L 0 B 」 《_(}('」 

当且仅当 B 相似于 C. 

14. 设 C6JVL 是 d 知的，证明， A 次直和 


B 

0' 



「 C 

O ' 


B 

0 、 

、 1 

e 

与 

^0 C 


e M h „, k'^i 


b \ 



CL 



相似， 当且仅当 B 与 C 相似. 

15. 设和是已知的，证明，直和 


~A 

0 

I 

i - 4 

O ' 

B 



C 

0 ■■ 


0 ' 


6 M zt]hn ^ 

c . 



€ M„' b „ , 


相似，当且仅当 B 与相似. 


k ^ 1 


16. 设 AeM „ 有 Jordan 标准形 ' ( A ,) ㊉ … ㊉ L t ( AJ . 如果 A 是非竒异形矩阵，证明 A 2 
的 Jordan 标准 形是人 丨 （ A ? ' ( A ; h 即的 Jordan 标准形恰好由与 A 相同的一组 

Jordan 块组成，只是相应的特征值要取平方.与此类似的结论对所有幂 ,V 成立吗？举 

一个 2 X 2 的例 _ f 说明， 如果/\是奇异矩阵，1;述结论不成立. 提示： 如果/ I 参0,试证 K ( A ) 
的 JwcUm 标准形 （ 一个 Jordan 块 〕 是人 ( A :). 冉证明，如果 A /0, 

rank [人 ( X ) — A ] = rai)k |~Jl (A) — /]™ ， m = 1,2 ，…，方 
I7 - 如果 AeM,,， 证明， rank A-rank A ', 当且仅当特征值; 1 = 0 的几何重数与代数重数 
相等，即 -4 的 Jordan 标准形中相应 T A=0 的所有 Jordan 块（如果有的话)是]X 1的. 

进一步阅读一个给定的矩阵与 其转置 间的相似变换矩阵总可以取为对称 矩阵. 该事实的 
证明可参看0‘ laus.sky and H . Zassenhaus , "On the Similarity Transformation between a 
Matrix and Its Transpose , M Pan '/, ( ；, Math. 9 C 1959) ， 893-896. /+: (3. 2. 4) 节末提到了定 
理 ( 3 . 2 . 4 . 2) 的逆命题也 成立， 其证明可见 [ HJ ]. 


3.3 多项式和矩阵：极小多项式 


如果/>("=^十％ 〆 1 十心 2 + m + a [ f + a ., 是给定的多项式，那么，对于任一/\云 
M „, 可以定义 
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p{A ) = /\* -|- [ A* 1 ^ a ； A + f. 

在多项式与矩阵之间存在一个重要的相互关系.我们已经论述了特征多项式的重要作用，佴是 
还有其他 些与个 方阵相关联的多项式> 其中之 是 极小多项式. 

Caytey - Hamilton 定理 （2,1.2 i 确认.对毎一个 AfcM „, 存汴 '个 ”次多项式（特征多项 
A) Pa (D, 使得 h (/) = 0 .说 个多项 式零化 A , 是指它在/\的值是0矩阵，也4能有零化 A 
的》—1次多项式.或《—2次多项式，但是很明丛.因为只存在有限多种可能性，所以，对每 
个 A 6 M ,,， 有一个零化 -4 的次数最小的多项式， U . 它的最小次数至多是如果 〆 A )=0, 
那么对任 -- r & C , cp(A)'=0, fi 然，总可以规范化 -- 个 非零的 零化多项式，使其最高次项的 
系数垫 + 1. 如果一个多项式的 S 高次数有系数1,就说它是 f 一多項式， 应指出的是.一个 
竹一多项式不可能恒等 丁零. 

3.3.1 定理 A 6 M „ 是已知 矩阵.则仅有一个零化 A 的次数最低的首一多项式这个多 
项式的次数至多是 K 如果/心）是使 〆 .4) = 0 的任一多项式，那么. t ⑴必除尽/>⑴. 

证明： 特征多项式是零化 A 的一 个例广 它是，;次多项式，于是存 ft 次数为》,4^的首一 
： L 42 j 多项式 V "，使得 g ( A )_ o . 如果/ ■(/) 零化 A , IU ⑴是零化 A 的次数最低的冇一多项式， 
那么 Vf ) 的次数必须小于或等于/> ( 0的次数.因此，根据 EudW 算法，存在多项式 Wf ) 以及 
次数小丁 y ⑴的次数的多项式 Kr ), 使得 p { t )- r i ( t ) h ( t ) + r ( i ). U ^ 0 -- p ( A )^- q ( A > h ( A ) + 
r ( A ) = 0/,( A )4 r ( A ), Wifli r(Aj 0 . 加果 r(() 笋 0 . 可以把它规范化，从而得到一 f ■零化 A 
的而次数小于 />( f ) 的次数的首一多项式.因为这与； 》(/) 的极小性相个盾，所以得川 K /) 一 U ， 
因而 ( ;( f ) 除尽 〆 /)，且有商 / Kf ). 如果有两个霉化 A 的次数最低的首一多项式，上述沦证说 
明，每一个都除尽另 一个； W 为它们的次数相同，所以其中一个必须是另一个的一个纯量倍 
数.然而，它们都是首一的，纯量因子必须是+ 1 , 因而它们是恒等的. □ 

3 .3.2定义设 A 6 M „ 是已知矩阵‘零化/\的，次数最小的唯一 ff 一多项式 fe ( f ) 称为 A 的 
极小多项式. 

3.3.3 推论相似的矩阵冇相 N 的极小多项式. 

证明： 如果 /U 召， SeM „, KA--SBS \ 那么， l iAA )^ q B ( SRS " 1 ) - S (!li ( B ). S ' ! - 0 
于是处的次数 4 〈小于的次数 . Rj 是所以問样的论证说明 wU ) 的次数不 
小丁办 （;） 的次数.因此，这两个 f 一多项式有相同的最低次数且都零化 A ， 于是根据定理 
(3.3. 1)，它们必须恒等. 口 

3.3.4 推论对于每个 A & M ,,， 极小多项式如 （ n 除尽特征多项式丸,（ (） 此外， w ( A )=0, 当 
9仅当 A 是 A 的特征值，因而 p A ( t )^ 0 的毎个根是 (/ ,(/)=0的根. 

证明： p . x U )^ 0 , 由定理町知，存在多项式 / i ( i ). 使得二 / iQW . tC /). 这个分解 
使我们看到，如=0的每个根是 /).,("—0 的根，因而 g .. iQ )=0 的每个根迠 .4 的特征值.如 
果 A 是 A 的特征值，且 ' r #0 是相应的特征向； y ；. 耶么 A.r = A.r fi . 0 — f //! = (A ). r , 因此 

办⑴^。. □ 

这后.个推论说明，如果把特征多项忒； ( M ( f ) 宂全分解成 
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Pa(^ = JJ (，— A ,)、 ， 1 ^ ^ 7J T h - 二 … + a 、，= n, (3, 3. oa) 

]=I 

Mr 中 Ai，A 2 ， …，各不相同，那么极小多项式必须有形式 

= f[(f-AJ' , i < r < ■、” （3. 3. 5b) 

: -l 

原则上，这给出 了一个 求已知矩阵 A 的极小多项式的算法： 

I- __先，假定通过求特征多项式以及对它做完全分解，计算出 A 的各个特征值和它们的 
代数重数.设法确定分解 （3. 3. 5a). 

2. 在 <3. ISb) 中，有冇限多个乘积形式的多项式，从所冇「, = 1的乘积开始，通过直接验 
算，确定零化 A 的，次数最低的 多项式 . 这就是所求的极小多项式. 

从数值计算考虑，这不是 •个 好的 算法. W 为对 f ' •一个大矩阵，耍牵涉到分解其特征多项 
式的问题.但是，对于手算一些形式简单的小矩阵的极小多项式，它可能是很有效的. 

练习设 A—G 求 A 的极小多项式 gA ( f ). 

A 的 Jordan 标准形和/I的极小多项式之间有着密切的联系.假定 AzSJS'- 1 是 A 的 
Jordan 标准形，0_先假定 

「A 1 0" 

| . '' , e m „ 


只 是-个 Jordan 块. A 的特征多项式是 ( r — A )"， 乂因为如果 M ( J - A /) V 0, 所以极小 
多项式也是 G — A )". 如果 

「人丨⑴ 0 1 

J — [ M „ , 

L 0 八■⑴ J 

其中〜 那么 ./ 的特征多项式仍为 G — Ar , hj _ 是现在 （ J—Afr =0,并且没冇较低 的幂等 
T 零. 因此.极小多项式是如果有更多的 f 块， 结果是相同的： J 的极小多项式是 [ JT .；. 
(/ — AV ， 其中 r 是相成于 A 的最大 jonbn 块的阶数.如果 J 是一般的 jordan 矩阵.那么极小 
多项式必 Sii 包含每个不 N 特征值 A , 的个因式 O — A ,)’ ，且 - 定是相应于 A , 的最人 Jwdrni 
块的阶数；没有更低的幂叶以零化相应于 A , 的所冇 Jordan 块并且也不需要更卨的幂.因为 
相似的矩阵有相同的极小多项乂 . 我们已经证明 r 下述定理： 

3. 3 . 6 定理设 A 6 M „ 是匕知矩阵，其不同的特征值 MA , ，…， A ,,,. A 的极小多项式是 

沿⑴- n it A,y ， (3.3.7) 

其中 ^是4的相应 于特征值 A , 的最大 jordan 炔的阶数. 

实阮上，这个结果在汁算极小多项忒时不是很有用的，因为确定一个矩阵的 Jordan 标准 
形比确定它的极小多项式更难.- 些： 况 n .， 只要知道 r 一个矩阵的诸特奸值，它的极小多项式 
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町以通过简甲.的试凑法来确定.不过，冇一个里要的理论性推论.因为一个矩阵可对角化.当 
且仅当它的所有 Jordan 块冇阶数],所以，在 （3. 3. 7) 中，可对角化的一个必要充分条 件是所 
有 r , = l. 

3.3.8 推论设/\是已知矩阵，它的不同的特征值是 A , ，心，…， A ,„. 那么.，4可对角化.当 
且仅当 g ( A )-0, 其中 

q (.!) -(卜 1)(卜 A 2 )-(f — ； L ). (3.3.9) 

在确定一个 R 知矩阵是否可对角化 B、f. 这个准则是很实用的，因为如果知道一个已知矩阵 
的特征值，就容易写出多项式 (H9). 然应 着它是否零化 A， 如果它零化 A , 它-定是 A 的 
极小多项式.因为没肩更低次的多项式能以 A 的/«个不同的特征值为根.把上述结果用下述 
几种等价的方式来表述，有时很有用. 

3.3.10 推论 设 A & M ,, 是已知矩阵. F 列条件中的每一个都是 A 可对角化的必要充分条件： 
Ca ) 极小多项式有不同的线性因子. 

Cb ) 的每个根有 S 数 1. 

( c ) 对于使如 （?） 二0的所有拫，导数 

对于已知矩阵已经讨论了求一个零化 A 的，次 数最低 的首一多项式的问题.然 
Ifij ， 艾于它的逆问题乂如何呢 ■? 给定一个首 - 多项式 

p(,t) — t" -\ 1 1"' 1 4 山， "f" 1 ; + …十 a M ， ( 3. 3. 11) 

存作.个矩阵 A 使得是其极小多项式吗？如果有，力的阶至少必须为 nXM 要求这样… 
个矩阵足不困难的.考察矩阵 

[0 


A = 

0 

并且看到 

/ f*i = — A ' e , , 

A ^[ = t -； = At»i , 

At,_ e :i = A 2 £-[, 

Ae. t =- e,_ = AV ], 

/K , = - A ™ Vi : 

A % =— a „ , e„ -- a„- 2 e„ : — — a,e-, — m 

= ]. A ™ Vi ■■ a ^ A " 2 e , - — a „ e , = 4 V ! 

=[ A " — / i ( A )] e ,. 


e M „, 


因而 
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( a l . e l - rthAe ] + a ? A 2 e \ 卜…十 a『 L # V ])+ AV ] 

=[々(A) - A n ] e ] --\- [A r, — /)(A)lfi — 0. 

另外，对每个是 =1 * 2，…，方， / j (A)f^ = />CA)A t_] = A ^ L fi(A)a 二 A 卜] 0 = CK 因为对每个 
基向莆 Q 存/我们得知/^)) = 0. H 此.是零化 A 的《次首一多项式 . 如果 
存 在零化 A 的，且冇较低次数州>«的多项式 ] r - i + … H lf + h ， 那么 
0 二 q (, A ) e ： = ,4 ) J V , 十 L 卜4『> 如…十 - j - 
二 r ^-i^ ;l - -t h\e -： -\-h^.e Y — 0 , \['[^\ 

它推出基向量〜 U 与基向 Me. ^，…， L 线性相关.因为这是不可能的，由此得出〆 r) 是 
零化 a 的，次数最低的唯一首一多项式.另外，因为 /an 有次数》， .4e m „ , a 特征多项式 
/h(f) 也是零化 A 的”次首一多项式，所以 （3 .】2)的特征多项式. 

3.3.13 定义矩阵 U. 3. 12) 称为多项式 (3.3. U ) 的友矩阵. 

巳舒旺明 f 下述定理： 

3 .丄I 4 定理每个扦一多项式既是它的友矩阵的极小多项式，又是其特征多项式. 

稍后，我们将提出儿种不 N 的方法来确定包含一个矩阵的诸特征值的区域.因为一个多项 
式的芩点是其友矩阵的特征值，所以这些方法可以用来估 i 十一个多项式的各零点.见 (5 . 6) 节. 

如果是一个已知矩阵，我们可以计算其特征多项式 hO ) 以及多项式的友矩 
阵 （3.3. 12). 如果 A 相似十这个友矩阵，那么 （ W 为相似的矩阵有相同的极小多项式），由 
< 3 - 3 ' W ) w ] ■知， A 的极小多项式—定恒等十 A 的特祉多项式 /,,(/). 一般说来不会有这 
种情况，不过，如果 A 6 Ai 是一个其极小多项式与其特征多项式 Al (;) 恒等的矩阵，那 
么 A 的 Jordan 标准形 -- 定恰好含有.每个不同的特征值的一个 Jordtm 块.每个 Jordan 块的阶数 
等于作为 A 的特征(极小 〕 多项式的一个零点的相应特征值的重数.但是，多项式 Al( ;) 的灰矩 
阵的 Jordan 标准形与 A 恰好有相同的 Jordan 块结构‘因而它必须与 .4 相似， 这番论 证就是卜 
述定理的--个证明. 

3 .3.15定理矩阵 A€M, 相似于其特征多项式的友矩阵，当且仅当 A 的极小多项式与特征多 
项式悄等. 

练习 i£ 明，46从„相似丁'艽特征多项式的友矩阵，当 n 仅当/)是非减次矩阵. |]iy 

习题 ~ 

1. 设.4, /i6M 3 是¥零矩阵，证明， A 相似’当且仅当/\和乃有相同的极小多项 
式，这在 M, 中成立吗？ 

2 . 假定 AGJW , 是已知的.旦 A 的不间的特征值 A .,， …，尤,，也是 d 知的.试用 

a 3. 6) 证明，极小多项式（ 3 . 3 . 7 )可以用 F 述算法来确定：对每个 i = l ， 2,…， m ， 计算 
( A - Z , •••, n . 设： ■，进 使 mnkL 4 - A 』/)* = rank(A - AJ )* 1 ] 的最小 々值， 这个数 

r , 称为特征值 A , 的指标. 

3. 矩阵 A6M„ 是幂等的，如果/V二 A. 利用 （3.3. 10) 证明，每个幂等矩阵是可对角化 
的.提示： 试证 P t = !( t - \ )^it -A. A 的极小多项式是什么？如果 a 是三次幂等的 d — 





A ), 你能说些什么 _? 如果# = A 呢？ 

4. 如果 JI 对某个 有 A fr =0, 证明对某个 rgn 有 A ’=0. 因此，每个 W 零 
矩阵有一个其指数不大于该矩阵的阶数的等于零的幂. 提示： 如果户 U ) = /零化 A ， 想一想 
(3.3.1 ) 关于极小 多项式是怎么说的？ 

5 . 证明 Grayn - Schmuh 过程有下述应用，那就是，对于一个给定的矩阵 A 6 M ,, ,既不需要 
知道它的特征多项式又不需要知道它的任何特征值，也可以直接计算 *4 的极小多项式. 

U ) 设映射 7': — C " 2 定义如下：对于任一 A 6 M ,,， 把它按列块分成 A —[ Ul ， 

设: t ( a ) 表示中唯一确定的向量，它的前《个分景是第1列的各个分量，它的 n +i 
到2»个分量是第 2 列的各个分量，如此等等.证明，这个映射7—是向量空间 M ,, 与间的同 
构(线性的、一对…的和到上的）. 

( h ) 考察中的诸向量 

- T(A),l', = - 'i'CA* 

^ k -^ 0 , I , 2. n . 试用 eayley'Hamilton 定理证明， U _。， 叫， …， 是一个相关组. 

( cO 把 Gnmi - Schmidt 过程按给定的顺序应用于叫量组（叫,_ r . …， iU 直到产生第一个零 
向量为止.为什么一定会得到一个零向景？ 

( d ) 如果 GmmSdimidt 过程在第々步产生第一个零向量，证明 A --] 是 .4 的极小多项式的 
[ I -18 J 次数. 

( e ) 如果 Gram - Schmidt 过程产生向量心叫 lUi +“.+mj — 0, 明 

广 1 (ttatJ,, 十 aiU + …+ 0(--i 1)= ⑴ / + aid 十 a. A 2 +- h ff^i.4*" 1 = 0, 

由此得出， g A ( f^-( at , 广]+… + 〜 P + a 1 / + a ; l ) V i - 丨是 4 的极小多项式.为什么,^0? 

s . 按习 ® 5 中算法的要求进行计算，分別求匕^], 丨]和匕 u 的极小.多项式. 

7. 考察说明- ■^和 fiA 的极小多项式不一定 相同. 但和 

的特征多项式足相同的.说明時征多项式和极小多项式之间为什么存在这一差别. 

8. 设 i -1, 2, k. 且设仏⑴表， j ;- 每个 A . 的极小多项式.证明直和 

" A , 0 

0 A ,_ 

的极小多项式是 q ,( A ), ^(/) 的最小公倍式.这个唯一的’次数最低的酋一多项式 

可被每个 4(;) 除尽.件意，上述论证给出了引理 （].10) 的一个不同的证明. 

；). 如果 A ^ M ：. 的特征多项式 p ^( t ) = (i —-1)' ; C(-i- 6)* 和极小多项式 h (r) = (( —4):(/ + 
6) ，那么 - 4 的〗 urdan 标准形是什么？ 

J0 - 用直接计算证明，多项式 (3. 3. 是友矩阵 a 3. 12) 的特征多项式.提示：利用余子 
式计算行列式. 
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11. 有时，多项式 (3. 3. 11) 的友矩阵定义为 


"—1 2 …- d-,~ 

1 0 … 0 

「01 0 - 

1 

: *, 

或 1 ' + 

0 

- 1 0 . 

0 0 1 

L— — «| … —u ;l !_ 


证明， 这两个矩阵与 （3. 3. 12) 有相同的性质： （3.3. 11) 既是该矩阵的极小多项式，又足它的特 
征多项式. 

12. 说明，不存在其极小多项式为1的 3 X 3 实矩阵，但是存在具有这…性质的一个 
2 X 2 实矩阵及一个 3 X 3 复矩阵.提示：利用 （3.3. 4). 

13. 虽然相似的矩阵有相同的特征多项式和极小多项式，说明4阶或更髙阶的两个矩阵可 
能有相同的极小多项式和特征多项式而它们不和似. 提示： f 虑 


IH 9； 



「0 1：0 0 

lo 0 ' 0 0 

0 0 , 0 0 

0 0 : 0 0 _ 



说明4是这种情况可能出现的最低阶数. 

14‘ 如果 A , B 6 M „ 是相似的.而⑴是个多项式.那么 MA )=0 当且仅当 〆 二 0. 
试用前一个习题的例 JH 兑明，即使 A 与 B 不相似，/ >( A ) 二0当 a 仅当 〆 月 ）= 0 也可能对每个 
多项式 〆 i ) 成立.为什么会出现这种情形？ 


15. 设 A 6/ W „ 是已知矩阵，且设/ >(/) 是一个多项式).说明 P ( A ) SM „ 
的子空间.且它还是 M ,, 的 f 代数[尸 M ) 在乘法 f 封闭].证明 P (/\) 的维数是 A 的极小多项式 
的次数. 


16. 如果 A , 冇相同的特征多项式和相同的极小多项式，且它们的极小多项式与它 

们的特征多项式相同，证明 A 与 B 相似.冉利用这个事实证明，关于习题9中所提到的友矩 
阵的其他各种形式都相似于 (3. 3. 12). 


3.4 其他标准形和分解 


除了 Jordan 标准形以外，还有几种其他的矩阵分解 ： 它们可以用于各种不同的情形 . 

当矩阵 A 只有实元素时，首先考虑 Jordan 标准形 （3 . h 12 ) 的一个变形 . 这时，所有的非 
实特征值必须成共轭对出现 . 此外，如果 A 是实的，那么 rali k(A—A;)* = rank(A 二 17)* = 
mnkM—A/) 6 对所有和所有 1 = 1，2 ‘ … 成立，因而，相应于任 . 特征值 A 的诸 J or d an 
块的结构与相应共特征值 X 的诸 Jordan 块的结构相同 . 丙此，相应于各非实特征值的所有 QJ 0 j 
阶数的伞体 Jordan 块（不仅仅是 1 X 1 _f 块） 成相同 阶数的共轭对出现 . 

例如，如果 A 是实矩阵 /\ 的一个非实特征值 . H 1 (A) 以某个确定的重数出现在 A 的 
Jordan 标准形巾，那么 _/ 2 (X) 也必须以相同的虽数出现，分块矩阵 
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的 24 X 以实分块矩阵 . 这些论述导出 f 实 Jordan 标准形 . 


3,4.5 定理 


每个实矩阵相似于具有形状 


C„Aa z ,f h ) 


0 


! 0 

L 

的分块对角实矩阵，其中，对于 6=1 ， 


C' 、 ia p ,b p ) 

L ,( A ,) 


a 4. 6 ) 


L.a )」 

2, … ， A* 二〜十也是非实特征值，和心是实数， 


时 A,, … ， 夂是力的实特征值 . 每个实分块二角矩阵 ( 山，心） 6 财、具有形状 (3.4.4 ),且 
对应十 A 的 Jordan 标准形 （ 3. 1 . 12 ) 中具有非实 ; U 的一对共轭 Jordan 祙人 4 U*) ，入 , （L ) 6 
M„ t . (3.4. ti) 中的实 Jordan 块九 , （ A*) 恰好是 (3.1. 12) 中具有实心的 Jouian 块 . 

我们已经从一个实矩阵的一般（复 ) Jordan 标准形 （ 3. 1. 12> 推导出它的实 J M d an 标准形 . 


这样处理的优点是，它正好说明实子块匕）的阶数和个数与 A 的复； Iordan 块结构是什 
么关系 . 但是这样处理的缺点是，把 A 变换成 (3. 4. 6 ) 的相似矩阵可以选取实矩阵这个事实是 
不明显的 . 


IM . 


事实上，如果 A 是实矩阵，那么总有一个非竒异的实矩阵 S, 使得 S- 1 AS 成为实 Jordan 
形 (3‘4. 6X 可以通过下述个步骤来证明这一事实，这些步骤正是在 （ 3. i) 中的 Jordan 标准 
形定理的证明中所采用的 . 酋先， 用 Schur _r: 角化定理的实形式 （ 2. 3. 4) 代替复形式 （ 2. 3.1). 
在第二步 和第 - 三步，可以模仿在复情形下的论述，说明在每个步骤都可以采用实相似，最终将 
实形式 ( 2 . 3 .4) 化简成变 f 形的渚 = 角子块或渚 Jonkn 对角子块的一个直和，其中.主对角线 
上可能有形如 （ 3. 4. 3) 的 2X2 实子块 C(a, b), 

复 Jordan 标准形 （ 3. 1. 12 ) 是诸上三角矩阵的 … 个育和，而实 Jordan 形 （ 3. 4. 6 ) 是诸 
Hcssenberg 矩阵或 “ 近乎上 = : 角 ” 矩阵的一个直和，这是因为每个实 2X2 子块 CU, W 在主对 
角线下冇一个元素 . 


我们也能提出其他的标准形，它们是一些友矩阵的赶和.这种形式对复矩阵有一定的要 
求，但也有以下优点，它们适用于不同 fC 的域，而 Jordan 标准形对这样的域却无能为力 . 

设 AeAC 是 - 个 Q 知矩阵， U 它的 Jordan 标准形是 （ 3. ]. 12 ). 把相应干每个不同的特征 
值的所有 Jordan 块组合作 … 起 . 从每一组中选一个最大阶数的〗 ordan 块，并把它从诙组中取 
出 . 设故表示所冇这些取出的子块的贯和 . A 有多少不同的特征值 . 那么 ij , 屮将冇多少个直 
加矩阵 - 现在 从每一组所余下的 _?-- 块中选一个最大阶数的 Jwdan 块，且把它从该组中取出， 
设 ^ 表小所有这些 f 块的 _f[ 和 .b : . 中直加矩阵的个数可能少 r 凡， W 为某个子块可能已逛 
空集； 即 A 的某个特征值可能只有一个相应于它的 J 0r d all 块 . 继续作 S 和 B, , 达，氏，…， 
a, S 到所奋 Jordan 块组都成为空集 . 坎的阶数是单闽不增的 . f 是取 ©…© 认 S 换 
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相似于 A 的原 Jodan 形 （3. 1. 12). 

由于已作出的各个直和队是按 I ：述方式构造出来的，所以每个札的极小多项式与特征多 
项式是相同的.事实上，氏的特征（极小）多项式恰好是 A 的极小多项式.因此，根据 
(3.3.15)，每个氏相似于它的恃征（极小）多项式的友矩阵. 

矩阵认 的特征(极小）多项式称为的不变因式注意，它们的次数是单调不增的， 
且每个 / tr ] ( r ) 除尽八 U . 2， …， ,s - l . 第一个不变因式是 A 的极小多 
项式，且所有不变因式的乘积是的特征多项诸不变因式 按一种 确定的方式由 A 的 
Jordfm 块结构所确定，而 A 的 Jordan 块结构被 A 的各特征值 A , 及 （ A — A , f ) 的幂的秩序列所确 
定.闽此，相似的矩阵将有相同的不变因式，又闵为不变因式也确定 A 的 jordern 块结构 ，所 
以，具有相同的不变因式的两个矩阵必定相似.因此一个矩阵的不变因式序列（它包括极小多 
项忒[1确定特征多项式）是多项式 相似不变量完 全集：两个矩阵 A , B 6 M ,, 相似，当且仅当它 
们的各个不变因式是恒等的. 

另一种描述 A 的不变因式的方式是定义/, (n = C /- A ! V ■- … （/ — 为 A 的极小多项式. 
首先 A 的 Jordan 标准形中去掉相应于 /,(/) 的每个因式（(-；\.) '「的 _个 Jordan 块（这些 IF 是构 
成的诸 Jordan 块）， 设 A (f > = h - A ! V '…— A ,„ 广"是余 f 的 Jordan 形的极小多项式.之 
后又去掉相应于每个因式 — 的一个于块，且设 /,(?) 是余下的 Jordan 形的极小多项式， 
等等.诸不变 W 式/ 〆 ;)正好是一系列被佧缩的矩阵的极小多项式，存每一步都要从被压缩的 
矩阵中去掉某》 Jordan 块. 

用不变 因式米刻划相似矩阵在理论 h 是受欢迎的，这是因为它清楚地说明为什么极小多项 
式和特征多项式一般不足以判别相似件，但是它实 陆上没 有把任何内容加到已经知道的准则 
里： 两个矩阵相似，当且仅当它们的】 urdan 标准形是相问的. 

另方 M ， 这样的描述可导出 A 的一个新的标准形，称之为有理形，这是因为只需对矩 
阵 A 的诸元素施以有理运算便可算出它的各个不变因式. 

3. 4 .7定理 每个矩阵相似于它的各不变因式的友矩阵的冇和. 

因为 d 经有了 Jordan 标准形.复矩阵的有理形 （H 7 )似 f 就没有什么用处了.引进了它 
的理由是，它的另一种形式在任意域上成立，不只限于复数域.域 F 上的任一矩阵在 F 上相似 
于它的各不变因式的友矩阵的亢和，这些不变因式是系数取 F 的唯一确定的多项式.我们对 
实数域来说明这一事实. 

如果知实矩阵，那么 A (可能经一个复相似变换）相似于直和达 ㊉ … 
㊉ 汉，按这个次序，它相似于它的不变因式(项札的特征多项式， ^-1, ,) 的友矩阵的一 

个芭和 . A 的相应于非实特征值的诺 jordan 块必须成共轭对出 现. 如果相应于一个非实特征 
值的一•个子块出现在任一凡中，那么它的共轭也一个出现在同一个执中，、.于 
是，每个认有 t 实特征多项式，且由（ 3 ..1. 7 )所确定的形式是一个实矩阵.实矩阵冇理形的 
这个形式实际上可经一个实相似得到，我们略去了它的证明. 

3.4.8 定理毎个实矩阵 <4 eM „( K ) 在 R 上相似于实首一多项式扣 （ 0...九 (/) 的友矩阵 
的 一 个/!；和，其中每个九 . ^ 除尽九 （ f ) ， k =\, 2 . ■■■ , . s —1. 多项式 /),(;) 是 A 在 R 上的极 



小多项式，乘积/ >,( f ) … A ⑴是 A 的特征多项式，月每个 A ( f ) 是 A 在 R 上的一个不变因式.多 
项式 AG ) 是唯一确定的，因而 R 上的两个实矩阵相似，当且仅当它们有相同的不变 闽式. 

我们着重指出，相同形式的定理在有理数域 Q 或任一其他域上也成立.之所以得有理形 
这个名称，其原因不外乎是，将矩阵化成所述形式一般可以对 A 在 F 中的元素作有 
限多次有理计算来完成.因此，如果 F 是有理数域 f 只需采用具有有理元索的相似矩阵和有理 
系数多项式. 

一个涉及友矩阵的不同标准形也叮以由 Jordati 标准形 （3. 1.12) 推导出来.注意到每个单 
独的 Jordan 块有 性质： 它的极小多项式和特征多项式是相同的.于是每个 jonkn 块九 /A, >相 
似于它的矜征多项式 (;一A,)"， 的友矩阵.因此，整个 Jordan 标准形相似于这些多项式 
的友矩阵的一个 直和； 这些多项式称为4的初等因于.值得指出的是，用这种方式分解/V时 
的直加矩阵的个数比分解 A 为有理形时要多；每个不变因式可能提供多个初等因子. .4 的所 
有初等因子的乘积是 A 的特征多项式. 

如果 A 6 M „( R ), 则在 C 上计算它的 jordati 形和初等因子时要注意到它们必须成共轭对 
出现.如果将子 块人, ⑴和 . L , ( A ) 组合成一个直和，所得到的子块有实多项式 G — A )", ( f - Ar . 
作为它的特征多项式和极小多项式，因而它相似于一 （2 KeA ) i + U 的实友矩阵.后一 
个多项式是 A 的一个实初等因子.实线性因子的幂也可以作为 A 的每个实特征值的初等因子 
而出现. 

为了避免混淆，通常将与初等因 f 相关联的标准形称为有理标准形. 


3.4.9 定理 每个矩阵 -46jW„(R) 在 R 上相似十它的各（实)初等因子的友矩阵的宵和. 

相同形式的结论在任一域 F 上也成立：每个 AeM „( F ) 在 F 上也相似于它的各初等因子的 
友矩阵的 直和， 且这些初等因子是系数取0 F 的多项式. 


例如，考察矩阵 


A = [ 1 ] ， 





丨1设力= 4^©.4 2 ©木出烏©/\,&吣.那么 A 在 R 匕的有理标准形是 4 = ㊉ 4©糸0八. 5 © 

[4] ㊉ [4]， U 初等因子为 .r -1，,分十9，/ I 9， j -4, . r ~4. 在 C 上. 4 的有理标 
准形是 AiSAyQDOSC 〜]㊉ [― W ]© L 4」®[4], 且初等因子为1, (. r -1)- , d 
-厂■十3;, J - + 3 / f J — l f r -4. A 在 R 上的有埋形是 ㊉ ① [4] 的友矩阵） ©(/ I , 
㊉ [4] 的友矩阵），且不变因式是 


/i (?) = (t~ 1)(/ —2) 2 (f £ + 9)(i — 4 〕和 / 2 (7) = (， 2 + 9)0-4). 

在 C 上， A 的有理形是(九 ㊉ A z @「3 n ㊉ [― 3 (1 ㊉ [ 4 」的友矩阵) ©([3 G @[ — 3 i .] ① [4]) 的友矩 
阵).应注意的是，不论把 /I 看成是 M „( R ) 中的，还是 M „( C ) 中的矩阵，这两个直加矩阵以及 
不变因式都相同，这对于有理标准形及其初等因子是不成立的.见本节末的习题2和 i 

在木节的其他 地方， 基本 t : 不采用实〗 ordan 形、有理形、有理标准形、不变词式或初等 
因子，在这里讨论它们，仅是因为它们在历 .史上 的重要作用，同时还因为在不同于 C 的域上作 
矩阵分析时，它们是必不可少的. 
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还有许多其他有用的标准形和矩阵 分解： 

U ) 极 分解： 每个八^从〜可以写成 A = P 【/， 其中 A 6 M ,, 是与 A 有相同秩的半正定矩阵， 
:顶 而 U 6 M , 是酉矩阵. MC 7. 3.3). 每个非奇异矩阵 At 5 M „ 也可以写成 A = GQ , 其中， 

是（复）对称矩阵 (G = GO , 且 Q 6 M „ 是复正交矩阵 ( QQ T = J ). 

( b ) 奇异值分解：每个 A 6 M „ 可以写成 A = V 2 W ‘ ，其中， V , 是西矩阵，而2 

6 M „ 是具有非负主对角元的对角矩阵，且 S 的秩与 A 的秩相问.见 (7. 3. 5). 

( c ) ’角分解：每个 AEAi 可以写成.4=[顶[厂，其中，卩 eM „ 是两矩阵，而尺是 
上三角矩阵.每个实矩阵 A 6 M „( R ) 可以写成 A = QttQ T ， 其中 QGAl ( R ) 是正交矩阵，而及 
6 At 」 是具有一个特殊结构的上 Hessenberg 矩阵.见 （2. 3. 5). 

( d ) 每个 Hermite 矩阵 A 6 JW , 可以写成，其中，是非奇异矩阵，而 
/( A )6 M „ 是以+ 1， 一 1，或0为主对角元的对角矩阵.在中，元素+ 1( — 1)的个数与 A 
的正（负 >特征值的个数是相 同的； 0元的个数等于 r ,— rank 九见 (4. 5. 8). 

(e) 每个正规矩阵可以写成 A = U / 1U * ， 其中是酉矩阵，而 3 & 财，是其主 
对角元％ -4 的各特征值的对角矩阵.每个实正矩阵 AGM ,( R ) 可以写成 A = QDQ t , 其中 Qe 
M „( R > 是正交矩阵，而 DeM „( R ) 是具有一个特殊结构的分块对角矩阵.见 (2. 5. S ). 

( f ) 每个使得 A = A T 的矩阵可以写成八=3尺14)5 1 ,其巾， s & M „ 是非奇异矩 
阵，而是主对角元为 | ] 或0,且其秩等于 A 的秩的对角矩阵，见 （4. 5. 12). 

每 = 的矩阵 A 可以写成4=(72"，其中，是酉矩阵，而 2 是具有 
非负主对角元的对角矩阵，2的秩等于 A 的秩.见 （4. 4.4). 

( h ) 每个西矩阵可以写成 V^Q- lF , 而每个（复）正交矩阵 re M „ 可以写成 P = 
Qe，1 ' 其中 Q ， t '， FeM „( R ), Q 是实正交矩阵 ( OQ r = h , E 是实对称矩阵 （ iT =£ r )， 且尸 
是实斜对称矩阵 （ F = — /^). 

⑴每个矩阵可以写成 A - SL/IXKS 1 ，其中 S 是非奇异矩阵’ u 是两 矩阵，而 2 
是具有非负主对角元的对角矩阵. \ HA . i . 10). 

习题 

[157] 1. 对于 

「00 -II 



L-i 0 0」 u ……」 

在 R 和 C 上汁算它们的极小多项式，特征多项式，不变因式，初等因子，有进形和有理标 
准形. 

2. 设 A 6 M „( R ). 假定 g (/) 是 A 在 R 上的极小多项式，而 /(/) 是焱在（:上的极小多项式. 
训么 /(0的次数 <9(0 的次数？为什么 /( f ) — 定除尽假定 + iPi u ), 
其中户 t ("和户 2 (/)有实系数.试证为什么 P , (/\)二办 （ A ) 二0? 

3. 试用定埋 （ S . 4. 7) 证明， 如果 A , 06 M „( F ) , . N . F 是 C 的一个子域（例如 F =^ R 或 0) , 
那么 A 4 Ji 在 F 上相似，当 R . 仅当它们在 C 上相似.提示 ：试证 A 在 F 上的有理形与 A 在 C 
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上的冇理形是相同的，且对于 B 也有类似的结果.这一结论是如何推广习题2的？ 

4. 设 A£M„(R), 且假定 A 2 二证明， n 必须是偶数，且有一个非奇异实矩阵 Se 
使得 



其中毎个单位 te 阵 

进一步阅读本节所论述的有理标准形是十分经典的，其更详细的论述可以在 [ HKu ] 屮 
找到.在-段时间里，实沁 nl an 标准形也为从事矩阵理论研究的人所熟知.但有关它的文献 
不多见.例如，关于实 Jordan 形的论述可在 [ Kow ] 中找到.关于其元素是有理数或整数的矩 
阵的标准形的讨论可见 [ Newl . 艾于特殊标准形的更为详细的讨论可见 [ Gan ]， vol . 2; 
「( Jant ] 和 [HJ ]. 

3.5 三角分解 

如果线性方程组 = 6 有一个非奇异-二角 （0. S . 3) 系数矩阵 A^M „, 那么计算它的唯一解 
^足相当容易的.阀如，如果 A 是上1角矩阵 

run … ui/ 

^=1 . , 


那么 dd 然后利用后向 替换； 确定 a ,, , t a, 

匕， 是含一个末知数的方稈，它确定 JVl; —般，方程组 

b, , J - 1 rt,n— i ，k — 2,… ， 2,1 

J -' 

中的每一个是含一个未知数的方程（只要 A + ,， …，已被确定），它确定 .r,. 

练习设 AeJW ,, 是非奇异上二角矩阵，如果采用后向替换，试算出解 = 6 所必需的纯 
W 乘法和除法运算的次数. 

练习如果力是非奇异 下二角 矩阵，写出作为 Ar 二七的…个解法的前向替换. 
aAeA ^ 是非奇异矩阵，但不 是一角 矩阵，应指出的是，如果 a 是用形如 
A = LU 

的分解形式给出的，其中， I •是下:_:_角矩阵， [/ 是上 H 角矩阵，那么解出 6 可以说是很 
简便的. 

练习如果 A = LL / 如上所述且非奇异，证明’ L 和 L ； 都必须是非奇异的，内而必须有非 
零对角元. 

为 I'lf iiJ ■以先用前向替换解 


然后 )fl.m 向替换解 


Ly =- b . 
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U.y = .V ， 

且所需计算 S 只是系数矩阵为简单的三角矩阵时的两倍.因此，如果得到分解 LU 所需计算量 
不太大，那么这种分解对解线性方程组是有用的.在这里叙述它们也是适宜的， W 为它们的形 
式特殊，而把一个矩阵分解成这种形式可以不用特征值，而是利用线性方程组. 


_ 


3.5.1 引理假定可以写成 

A = LU , 

其中 LfAl 是下一.角矩阵，而是 h 三角矩阵.对任一分块形式 

rAn 4)2 1 rf-n o 1 「i/!i Uu 1 

U 21 aJ' 1 = lu [J, L o t/J 

其屮 A u . , UueM t , k < n , 我们有 

= A u , 

Li \ U ^ = Ai ；, L 2 iU u — A z] , 


a 


L21 f./j2 = * 

特别是， r 和 U 的左上角子块一定构成 A 的相应子块的一个同型的分解. 
练习用分块乘法运算验证 (X 5.1). 


3.5.2 定理假定 A & M „. 且 rank △ = 如果 

del / UU , …尹0 ， } = 1 

那么 A 可以分解成 

A - LU . 

其中， LfM , 是下-:角矩阵， UeM „ 是上二角矩阵.并11可以适当选择分解便得 L 或 U 是非 
釺异的； L 和 I ；都可以选取非奇异矩阵， 当用 .仅当& = 即当且仅当 A 是非奇异的. 

证明：首先证明，在关十前主子式的假设条件下， A ({1, …，可以分解成 L (( l , …， 
走 } 〕 U ({1, …， k }), 且它们都是非奇异的.能够逐个地求出 I •和 L ； 的各相关元素.设九= 
[/「,]且 U = l >,,]. 令 N . 令匕二 〜， i = l , …， k . 求出 

j = 2,… i 

t M 

继续做卜'£.令吻=1，月.令 l =〜一/,•, 1 = 2, k . 求出 

叫-卜3’…上 
In 

冉继续下去，依次设 u 的各对角元为1,然 •求出 l (彳]，…，々））的下-列和(7((1，…， 

■Tool 的下一行.每次都有一个含一个未知数的方程需要求解.因为每个不为零[因为根据 
( HI ), det L ({/, ―, i})Xdet [7(0. ■■■, (})^det .4({1, •**, ；})], 所以这个方程将是 
可解的.这就完成 f A ( U , …，的分解. 

将 A 如 （3. '「>.])中那样分块.因为 rank A = i = rank ，由此可知 [ A ” 八二]的各行是 
[ AnU 的诸行的唯一线性组合，即对每 个唯一 确定的 ,, t ，有 




标准形 


115 


A ZJ = BA n 和 A 2 , = BA, 2 . 

现在将欲求的 L 和 U 冋样如 (3. 5.1) 中那样分块，注意到非奇异的、 ，和 已被确定.于是可 
以用 （3. 5. 1) 求出 


U |2 = ^] l ' A ]-» 和 1-21= A ^ it / n 1 . 

然后求出 

.4^ =. / J；1 (./]； + L； :: JJ2z A-jiL/j!*L] / A,j -{-L-^U-^ — n+L ?= [/ 2S 

— A- a -\- L !2 L f 22. 

为 r 完成分解，必需 ifi ] a 只需 

= 0, 

例如，可以选取(相应地，认 2 )为 M ，_* 中的任一非奇异下（相应地，上）三角矩阵，希望选 
取 [■&( 相应地， i ^) 为 0. 因为和是非奇异的， [ 或可以选为非竒异的.如果 A = N , 
L = ，刼 L / = [ k 就是可非奇 异的； 如果因为 / i 是奇异的， L •和 U 不可能都是非奇异 
的.这就完成了证明. □ 

3. S .3 例不是每个矩阵都冇一个 LU 分解.考虑 



如果 A 可以写成 


A = LU 



U I2 

U'a 


~[心=0将要求 L 或17是奇异的，但是 LLJ - A 是非奇异的. 


练习证明，一个非奇异矩阵的左上角有一个奇异主子阵.它就不可能有 LL / 分解. 


3. S .4 例焱云时„可以有1：1[/分解而不满足（3.5.2)的主子式条件.例如 



有秩1，但是它的1, 1元是 0. 

练习（ 3 - 5 - 4) 中的的分解足不唯一的，即使要求 U 的各对角兀都为〗.试写出 

厂0 01 

Lj J 的其他儿种分解. 

现在已经很清楚了，一个已知矩阵的 LJ 7 分解是不唯一的，它可能存在，或可能不存 fr . 
不过，这许多麻烦，或者是由 A 的奇异性，或者是由 A 的前主 f 阵的奇异性引起的.然血可 
以采用 （3.5. 1) 和 （3. S . 2) 的方法，对非奇异的情形给出一个完美的描述，并丑可以利用规范化 
便分解是唯一的（标准的）. 


3 . 5.5 推论假定是非奇异的.那么， A 可以写成 
A = LU, 

a 使是下二:角矩阵和为上=角矩阵，当丑仅当 


晒 
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det A(U ,.-,yp ^ o , j = h -, n . 

此外， L 和 U 是非奇沣的，而分解实质上是唯一的.矩阵 .4 可以写成 
A = L ' DU ' , 

其中.//(相应地， [-")6 M ,, 是所有对角几等于1的下(相应地，上）夂角矩阵.而 D 适由 
dm £)({1广.，川二心1 …,川 ， j =~ 

所确定的非*异对免矩阵.因+ f /， W 和 D 被 A 唯一 确定. 

练习利 ffla 5. 1). 5.2> 和前一个练习，咩细证明 （3. 5.5). 

再 M 到线性方程 ffl 

Aj . b 

的解法，假定 <4 eM , 不能分解成 LU , 但能分解成 PLLr ， 其中，是置换矩阵 (0. 3.5), 
Ifil L 和 [ f 如前，是 F 二角矩阵和上二角矩阵.这相当于在分解之前重排各个方程.在这种情 
形，的解法仍然 M 相当简单的， R 要作替换 

ly =- PV ； 和 U.r - v 

就是了.应当知迈，任一非夺异的 A 6 A 1 都可以这样分解.而 li 任一 AGM „ 可以分解成 
PUJQ , 其中也是一个置换矩阵， 

3. S .6 引理设 AeM „ 是非奇异矩阵.那么.存在一个置换矩阵 PfM t . 使得 
Het(/ yj A)({l.■■•,；}) 0, j = 1,… ， jt. 

注意， F J A 正好是 A 的各解的 ■个® 排， 

证明： 证明是对6作! ID 纳法.如果4 = 1或2,经过验证，结论显然成,'/ I ;假定结论 一貞到 
k - 1都是正确的. f 虑非奇择矩阵 A £ M 4 , 并且 夫掉它 的最后一列.余 F 的 1.1 列是线性无 
关的，因而含冇个线性无又解.把这些解调换到前 A — 1个解的位置，然后对位于上//的 
非奇异的 _ ] ) XU - 子矩阵应 用归纳 假设.这就确定了一个欲求的 整个置 换矩阵.因为 
PA 非奇异的，所以证明完毕. L n 

人 5.7 定理设 AfM „， 则存在置换矩阵 P ， Q 6 M . F 一.角矩阵 L 6 M ,, 和」:二.角矩阵 r / f ； 
M ,. 使得 

A 厂 PLUQ . 

如果 A 是非夺异矩阵，可以取 Q =/, 且 A 可以写成 
A -- P 1 , V . 

证明： 如果 rank 则八有…个々 XI 非竒异子矩阵 ( 0 乂 4 d ), 它可以通过互换 A 的各 
行和各列调换到左上角的位置.现在把 (3. S . S ) 应用于左上角，再应用 (3. 5. 2) 便得到第一型式 
的 分解. 如果 A 是非奇异的， （3.5.6) 表明，为应用 0. 5 . 2 )， 右边的置换矩阵是不必要的， 
_这说明第二个分解是正确的，证毕. □ 

习题 

1 -本节所提出的理论是就/乂〗分解而论的，其中 L 是下三 角矩阵， [/ 是十二角矩阵.试 
说明，可以平行地提出[几分解的理论，但这两个因般与 LU 分解的因 f 不相同. 

2. 从 （2, 6) 节习题3可知，任一 的£3尺分解可以有效地经 „ — 1次 
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换得到.这甲 Q 是 K 矩阵，而是上 「.角 矩阵.如果 .4 分解成 QJ ? 形，试描述"了以怎样解 
lit H. 

3. 证明， .46 M ., 可以写成 


A = LPJJ , 

其中 ieM , 是非奇异下=角矩阵， uen , 是非奇 异上： 角矩阵，而 P ,. 是一个次置换矩阵[当 
r.mk 时.置换矩阵中的一些元素1换成元素0,使其元素1的个数与 rank A 相 N ]. 提 
示： 进行初等行变换和初等列变换. 

1. 如果 -4 eM „ 的所有前主子式都非孓，试描述如何运用第种初等行变换将 a 的对角线 
F 方的各个元素都化成零*从 ite 使 A 有分解. 

5. ( Utiezos .--: 对角化算法 ■) 设 ASM , 和都是给定的，定义 A 4 … A " 1 
称 X 的诸列构成 - 个 krylov 序列.假定 X 是非奇异的. U ) 证明 X MX 的特征多 
项式的友矩阵 （3. 3 .12 〕 .（ b ) 若 KeM „ 是任意一个给定的非奇异上三角矩阵丨 = X 尺，证明 
S ’ 1 AS 呈上 Hessenberg 形式. （ c > 设 — veC K .[ J _ 定义 1，= [_.以1 ' . v ( A ' ) ; r .‘（ A ' r l . y ]. 假定 Y 
是非奇异的且可以写成 LDCZ , 其中. L 是下-:角矩阵，是上=角矩阵，目.都是非舒异 
的.闹 D 是对角矩阵且是非奇异的.证明，存在非奇异上 H 角矩阵 K 和 7', 使得 （ Xi ?) * = 
T - Y - S 使广 : T A 兄 K 是相似干 A 的三对角矩阵.（⑴若 AeiW „ 是 Hermite 矩阵，利用 f : 述 
思路确定一个算法来得到_ ■个 相似于 A 的- :对角 H « m , te 矩阵. 

fi . 两个矩阵；1， 称为等价. 指的是存在非^异矩阵 sew ,,, 和了6时„，使得 
B - SAT . 

( a ) 证明这个等价概念是 M 上的一 t 等价关系. （ b ) 证明，每个矩阵等价于一个形 
如 L ) 的 矩阵. 7 e M , , »}. 提示： 利用初等行变换得到行简化梯形， 

然后对所得到的矩阵采用初等列变换. （ r ) 证明， Al „.„ 中的两个矩阵等价，当且仅当它们冇相 
同的秩. （ d ) 假定…等价: Fa ) 屮所述的特殊形式，试用等价件阐述关 
于线性方程组 A.r — 的解理论. 

进一 步阅读 上述习题飞是从 [ Sw ] 改编过來的，中还可以找到关于 LU 分解的数 
值应用的其他资料. 


_ 






第 4 章 Hermite 矩阵和对称矩阵 


4.0 导引 

4.0. 1例如果/: D 是某个域 DCR " 上的二次连续可微函数，实矩阵 

称为/的 H ess i an 矩阵. 它是: r 的函数， W 为再以用它来确定一个临界点是否为相对极大值点 
或极小值点，所以它在最优化理论屮起着重要的作用 [〈见 7. 0)]. 

目前，使我们特别感兴趣的性质来源于混合偏导数相等的重要 事实； 这就是別 
所有 i . J = K 2, n 有 

疗 - 丹 . 

r? J- } tlji, 

用 Hessian 矩阵 H ，:/!,,」 来表示，这意味着，对所有 z ， ;-1, 2, - , n , 有心 =心；即 
H r . 设矩阵 .46 M ,,, 如果有4=4、就称它是对称矩阵.因此，一个二次连续可微的实值闲 
数的 Hessian 矩阵总是实对称矩阵. 

4.0.2 例作为第二个例子，设是某个具有实或复元素的矩阵，考虑由 A 产生 
的 R " 或 C " 上的二次項： 


QO ) = / Aj . = 

?卜厂=1 

« 1 

= 2 

= .r 7 A — A r )]jr. 

十是， A 和 A T ) 引出同一个 .一次 型，且后一个矩阵是对称的.因此，为了研究实的或复 

的二次型，只要研究由对称矩阵产生的那些二次型就 | 可以了.例如，在物理中，作为物体的惯 
性表达式，自然会遇到实二次型. 

4. 0. 3例作为第三个例子，考虑用 

LfU ) ^ (4. 0.4) 

定义的二阶线件偏微分算子 L . 假定系数％ (, r ) 和函数 / U ) 都是定义在同一个区域 DCIT 上 
的，且/在 D 上应当是二次可微的. 3『以用一种自然的方式把算子 L 与一个矩阵联系起来， 
矩阵 A = L 〜 （1)1 不- 定是对称的，但是，因为/的混合偏导数相等，因而有 

w =名， ( . r ) 孓生=名 


刚 





= ，矣士 hu ) 十 

因此，对称矩阵 (A + A 』 ） 与矩阵 A 产生同一个算子 L ,并 ti 为了研究形如 （ 4 . 0. 4 ) 的实的或 
复的线性偏微分 算子. 只要考虑对称系数矩阵就够了. 

4.0.5 例考虑无向阐 r : 即 r 由集合; v 和集合£组成，其中 W 是“结点”的集合丨 P ,， 
…， FJ , £是无序结点偶（称为“边”)的集合 pj , iP „ 2 , P ,」， … h 图 r 可以简 
沾地用它的所谓邻接矩阵 a = [« v 」 来描述.这里 

(U 如果 { iV/V 6 £， 

〜 T io . 否则. 

W 为 r 是无向图，所以 A 是实对称矩阵： UP A r ^ y \. 

4.0.6 例设是实矩阵，考虑实双线性型 

Q ( j 、 y ) t y T A ^ ^ 2 a ^ y < Jc i ' r v £ R \ (4.0.7) 

j j 

¥A = 了时，它简化为普通内积.如果希望对所有>有 Q ( x , y )~ Qiy , . r ), 那么它必需 
而且只需对所有 I ， ）=1, +■•, T 1， 有1,=七.为了证明这一点，只需注意到，如果和 
y = e ,， 那么 Q(V 0=\且必心因此，实对称双线性型自然与实对称矩阵相对应. 
现在设 A = [«,,] GA 4 是实的或复的矩阵，考虑复形式 

H (. r , y ) -= y ' / U ' — 2 a ^ y ^, , j - , 6 C " , (4, 0, 8) 

冏 (1 0.7) —样，当 A =] 时，它简化 为普遍 内积.这种形式不冉是双线性的，但是它对第一 
变元是线性的，而对第二变元是“ 共辆线 性”的 （ H < ar ， f>y')^ubH(j：, y )), 这正好与复 Eudid 
内积相同.有人称这种形式为半双残性的.如果希望像内积一样有 HU , y)^H(y, jc), 那 
么，与前述情形相同的论证说明，它必需而 H . 只需有\二 弋,； 即 _A = S T = A '. 要注意的是， 
如果 A 是实矩阵，那么 

使 A = /\+ 的的矩阵类在许多方而是实对称矩阵类到 M „( C ) 的自然推广.这样的矩 
阵称为 H « mk e 矩阵； 要注意的是，实阵就是实对称矩阵.非实的复对称矩阵类没 
有实对称矩阵类那么多®要性质.在本章.我们将研究复 Hermite 矩阵和复对称矩阵，并且要 
特别指出在实对称情形成立的那些 件质. 

4.1 Hermite 矩阵的定义、性质和特征 

4.1.1 定义矩阵称为 Hermite 矩阵，是指 A = A ’ ， 其中 A ‘三 A " =卩,, ]. 如 
果 A =— A *, 则称之为斜 Hermite 趄阵. 

XT - A , BeM n 的一些论断 ： 

1. 对所有 A + A ' ,丸 4' 和 A * A 都是 Hermite 矩阵， 

2-如果 A 是 Hermhe 矩阵，耶么，对所有々= ] , 2 ，3, …， A * 是 Hennhe 矩阵.如果 A 



Hcmiife 矩萍和对称矩阵 121 


还是非奇异的，那么，也是 Hermtte 矩阵. 

3. 如果 A , 是 Hermite 矩阵，那么，对所有实纯暈^是 Hermite 矩阵. 

4. 对所有八&财„， A - A ' 是斜 Hcrmitc 矩阵. 

5. 如果 A ， B 是斜 Ih - rmite 矩阵，那么，对所有实纯最 〜 h « A 十沾是斜 Hermite 
矩阵. 

6. 如果/ I 是 Herruite 矩阵，那么 / A 是斜 Hermite , 

7. 如果 .4 是斜 HormiU ' 矩阵，那么 ，_A M Hermiie 矩阵. 

8. 任意可写成 

,A = +CA + A — ) + j ( A - A ' ) ^ H ( A ) 十 MA )， 

其中 H ( A ) = + ) 是 A 的 Hermite 部分.而 S ( A ) = + (A A ’） 是 A 的斜 Hermite 

部分. 

9 - 如果 A 是 Hermite 矩阵，那么 A 的主对角元都是实数，为了给出 .4 的 V 个元素，我 
们可以&由地给定任意个实数(对于主对角元）和仟意个复数(对于非对角元). 

4 . 1.2 定理 每个 AeJW„ 可以唯一地写成 A=S+^r ， 其中 S 和 T 都是 Hermite 矩阵.它也 
可以唯一地写成 A = B 十 C ， 其中 B 是 Hermite 矩阵，而 C 是斜 Hermhe 矩阵. 

证明： 把 A 写成 A = |(/\+ A *) 十! [( —;/2)( A - A *)], 并且注意到 + + ) 和 

T =(~ i / 2 )(A 1 >都是 Hermiw 矩阵.关 丁唯 -性论断，我们知道，如果 A ^ E +疋， 其中 
E 和 F 都是 Hermite 矩阵，那么 

2 S = A f A ' = ( E+iFj +(£ + rF ) - = E + 丨十 — i 厂 = 2 E ， 

因而 £=乂 类似地可以证明， F = X 关于表示式 .4 = B + C 的论断也可用同样的方式来证明. 

n 

上述论断使我们联想到，如果把比作复数.那么 Hermite 矩阵就可以比作实数 . C 中 
的复共轭运算类似于 M „ 上的(伴随〕运算' —个实数是使^ = 5的复数一个 Hermite 矩阵 
是使 A = A •的矩阵正如每个复数 2 可以写成 z = s +, 7—样（其中 a , t 6 R ). 每个复 
矩阵 A 也可以唯一地写成 A=S + i _7\ 其中 S 和了是 Hermite 矩阵，还有另外一些性质进一步 
说明这种类似性. 


4. 1.3 定理设是 Hermite 矩阵.那么 
U ) 对所有 . r 6 C ", ，九 (.是 实数； 

(b) A 的所有特征值都是 实数； 

( r ) 对所有 SeM „, S ' AS 是 Hrnnite 矩阵. 

证明：计算 Ad =(_ T * A . r )" = r * A * / ? Ai , 于是？ A : 等于它的复共轭， 因而它 
是 实数. 如果 At = At 且那么，根据 （ a ), A = A.r ■：!■ =， h ： =， A . i ■是实数.最后， 
(S*AS)" =S* A* S-S' AS, 所以 S. AS 总是 Hermite 矩阵. □ 





练习 当„—1时， Hermite 矩阵的上述每个性质指的是什么？ 

(4. 1. 3) 的每一个性质实际上（几乎都)是 Hermite 矩阵的一个特征. 

4.1.4 定理 设八=[七]6仙„是给定的，那么， A 是 Hermite 矩阵，当且仅当下述条件至少 
打一个 成立： 

U ) 对所有 j 七 C u ， ■是 实数； 

( b ) A 是 IK 规矩阵 ， a A 的所有特征值都是 实数； 

< c ) 对所有 SfJW ,, 是 Hermite 矩阵. 

证明：这只要证明每个条件的充分性就可以了.如果对所有 . rec % T ’ A . r 是实数，那 
么.对所有 . r ， y e _ C \ ( x + jOMQ +. vkC ， A t -+.vU + (V A . vi,〆 是实数.因为 
根据假设条件， Ay 是实数，得出，对所冇 X , yec ： , //^十3_’/^是实数.加 
果选取 = o 和这就是说，叫十4是实数，因而] m 叫 = —Im 如果选取 j = f ( 和 

3* — &这就是说.一叫，叫是实数， W[fij R efI(; =Re « ;i . 这两个恒等式结合起来就等价于 
有乂因为厂走是任意的，因此得出八=/\' 

如果 A 是正规矩阵，它就是可酉对角化的，所以 A = UA (7_, 其中 ， A = diag ( A 1 , A z . 

Ad 是由 A 的各特征值构成的对角矩阵. 一 般地，冇 /r=uZcr, 但是，如果 A 是实矩阵，就 
有 A '= UALT = A . 最后一个条件推出 A 是 Hemute 矩阵，这只需取 S =_ f . □ 

因为 Hermite 矩阵显然是正规矩阵 ( A 尔 = A 2 = AM ), 第2章中有关正规矩阵的听冇结 
果都适用于 Ilenmte 矩阵.例如，相应千4;同特征值的特怔向量是正交的.存在正交特征向# 
的一个完 备集； Henmte 矩阵是可以酉对角 化的； 等等. 

作为参考，我们特別叙述 下述® 要结果. 

4.1.5 定理 （ Hermite 矩阵的谱定理）设 At 紙是给定的，那么， A 是 Hermite 矩阵，当 n 
仅当存在一个两矩阵 U 6 M ,, 和-个实对角矩阵使得 A = LMLT . 此外， A 是实 
Hermite 矩阵（即实对称的），当 U . 仅当存在一 t 实正交矩阵 A 1 和•个实对角矩阵6 M „ , 
使得 

虽然 Hemnte 矩阵的实线性组含总是 Hemnte 矩阵，但它们的复线性组合就不一定是 
Hermite 矩阵.例如，如果 A 是 Hermite 矩阵，那么，只有当 A = 0 时才是 Hermitc 矩阵. 
另外，如果 A 和 B 是 Hermitc 矩阵.那么 （ AB ) +二 iT .4, = R 4 ， W 此， AB 是 Hermite 矩阵， 
当且仅当 A 与 B 可交换. 

关于交换的 Henrnte 矩阵的最著名的结果之一（因为在量子力学中它是到算子的重要 推广） 
是定理 (2. 5. 5) 的下述特殊情形. 

4.1.6 定理 设7是给定的 Henmte 矩阵族.对所有 At ?, 存在酉矩阵 U ， 使得 U 4 LT 是对 
角阵，当目.仅当对所有 A , 

Hermile 矩阵 A 有 A 等于 A + 的性质，推广 Hermite ® 阵概念的一种方式是考察 A 相似于 
. A + 的矩阵类.下述定理用几种方式刻划了这一类矩阵，其中第一个是说，这样的矩阵必定相 
似于 〔 但不一定酉相似于) 一 个实的(但不一定是对角的）矩阵. 
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4.1.7 定理设 A 6 M , 是给定的，卜 述 诸命题 等价： 

U ) A 相似于矩阵丑 

( b ) A 相似于； 

( c ) A 经 Hermite 相似变换相似于 

(d) A = HK, 其中 H , KeM„ 都是 Hermhe 矩阵，且至少有一个是非奇 异的； 

( e ) A = HK , 其中 K 6 M „ 是 Hermite 矩阵. 

证明： 首先要指出的是 (a) 和 （ b ) 等价：如果 （ a) 成立，则 S *AS=B = T 1 i3 r T=T 1 B' T 
^T-'S'A- (S- 1 )-!', 这就是说， A* =(ST-'S- )-'A( ST~'S' ) t 或者说 （ b) 成立.如果 （ b ) 
成立，那么 /L 和 A " 有相同的_| 01 心1 1 标准形.因为对任意矩阵 A，A 4 A 1 相似， 这说明，如 
果 J 是 A 的 Jordan 矩阵，那么 J 必须相似于 J. 因此，对 J 中的每个 Jordan 块入 （ A) ，在 j 
中有一个相应的（相 N 阶数的) Jordan 块 LU>. 如果 A 是实数，就没什么町说的了，如果; I 不 
是实数，这就是说.相应于每个非实特征值的诸 Jrmkri 块和它的共轭必须成对出现.利用推 
导 a 彳.幻的论证，得必须相似于形如 （3.4.4) 的实矩阵的-个直和，因而 (a) 成立. 

为了 W . 明 （ h ) 蕴涵 （ c ), 假定 S l AS = A - , F 1. 注意到，如果对任意非零^ = ^'义(：， 7' = 
那么 r 'Ar=A 因而或等价地 ‘= _r a * . 相加这两个恒等式得恒等式 
A(T+T- ) = rr+r ) A * ,而如果 TM - T •是非奇#矩阵.这便说明 A 可经 HemiUe 矩阵 T + 
厂相似 T _ A *. 但是可选取《使了十了■非奇异，这是因为，了+了*非奇异，当且仅当 TMr 
1 P J ^ l + T^r 非奇异，或当且仅当 一）. 但是，乂因 
为可以选取 u 来得到任意0€[0, 2 tc ], 所以只需选取3使一#吞 WS W ) 即可.因而 （ b ) 蕴涵 

(C). 


其次.假定 （c) 成立，并且写出 ii ] AR = A ' ,其屮况是非奇异 Hermhe 矩阵.于是 
R 且 '). 但 (A1— 1 )' 二及 'A = A-R 因此 A 是两个 Hermiie 矩 

阵 R 和/ VJT 1 的乘积，且其中的 K 是非奇异的，因而 （<J) 成立. 

如果 （d) 成立，11 A-HK, 其中是非奇异矩阵，那么 H l AH = KH =( HK )' =A* , 
从而 （b) 成立.如果 K 是非奇异矩阵，证明是类似的. 

® .然 (d) 蕴涵 （ e ); 我们要证明 （e) 蕴涵 U ). 如果其中 H 和 K 是 Hermite 矩阵， 
H 都是奇异的，考虑 U‘AU=OT 其巾，是两矩阵.它把 H 对角化成 

形式 


:卜， 


使得 new , 是♦:奇异对角矩阵， k < n , 把矩阵划分成号同形的分块，使得 

[U 


U' AU = H f av KU)-- 


r — VDK ! ” 

— 0 0 I 

子块 DiTe / V ^ 是两个矩阵的乘积，其中有一个是非奇异的，于是根据 （ d ) 与 （ a > 的等 
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价性，相似于实矩阵用_/6於*表汞£1的 Jordan 标准形，使得 A 相似于形如 



的矩阵 C. 矩阵 C 是上二角矩阵.且它的各特征值是 J 的各特征值冉附加 n — A 个零特 征值， 
对于相应于任一非零特征值的诸子块，（：的 Jordan 标准形的 Jordan 块结构必须与 J 的相同， 
[173] 这是因为，如果义尹()，每个幂 （(:一Am] (列）秩显然等于 》—mnMJ -AD' r=l, 2, 
特别是， c 的相应于任一非特征值的 .kmkn 块必须成共轭对出现，因而 C' 的 Jordan 标 
准形相似于形如 a4.6) 的矩阵，它是一个实矩阵. □ 

习理 

1. 证明 Hermite 矩阵的每个主子矩阵是 Hamite 矩阵.这一件质对斜 Hermite 矩阵成立 
吗？对正规矩阵呢 v 

2. 如果 Ae M , 是 Hermite 矩阵，巨 S 6 H , ，证明 SAS * 是 Hermite 矩阵.如果 S 是非竒 
异的， SAi 1 又怎样呢？ 

3 . 设 A , Be A 1 是 Hem — 矩阵.证明， A 与 B 相似，当且仅当它们酉相似.提示：如 
果4 = 353、证明 A = LML /* 和 B — ,其中 U 和 V 是酉矩阵，因而 LTAU=A = 
V' BV. 

4. 验 MH. 1. 1) 下面的性质】〜9. 

5. 有时，通过证明一个矩阵与一个 Hermite 矩阵相似，可以证明它只有实特征值.关于 
这方面的一个经典例子如下所述：设八=[\]€财,,（11>是三对角 矩阵； 即心=0,若 | 〖 _ j | 
>1- 假定它的元素有很弱的 对称件 质，即对所有，=1，2, …， n ~ U 有 ^.,>0 .证 
明，存在一个具有正对角元的实对角矩阵 D 使得 DAi ) M 是对称的.因而得出 A 只有实特征 

值.考察 f —Y JJ ， 试说明为什么关于 普:对 角元的 符弓假 定是必不可少的-试用极限理论证 

明，如果〜*>0,那么特征值是实的结讼仍然成立. 

6. iiH 明在下述意义下每个矩阵由它产生的 Hermite 型 A . r 唯一确定：如果 A = 

[ A ], B = 是铪定的，证明，对所有: retT 有，当乱仅当八=汉提 

示： 如果对所有: rfC ",， Ai =0, 考虑 (. r +. y )‘ A (. r +>0, 然后证明，对所有 x , : yfC ", 有 

+ 0. 选取 I = 5CR, 证明，对所有 tfeR 和所有厂 *-1, 2, 

有 a t y "'= ' a , t , 

1 - 证明，如果矩阵 A & A 1 不能由它产生的二次型 . r 7 A ^ 唯一 确定； Ell : 如果 
2 ，则存在 A，a A ^ B , 使得对所有 . r er 有 提示： 如果 C >— C ’ T , 
/Cr 是什么？ 

证明，矩阵不能由它产生的 Hfrinite 型的绝对值 | J -* A .1- ,所确定，提 示：设 

_ n 11 

HIl ] J ' 然后证明，对所有 xGC 2 , I .,'"/!；■ i - U ‘/ Vj I , 

9. 证明，在下述意义下，矩阵 A 几 —f ■由它斗成的 Hermite 双线性型的绝对值所确定，若 
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A , 是给定的，证明，对所有 _ r , jec 有 | . r * A 3- I = I .T-By \ , 当且仅当对某个 

有 •提 示 ： a A =[ a r) ] a -B =[*,-,]. 利用 x = 和; y =~ 证明，对 所有! _， 

… r 7! 有 I a ,, I ; ) ~ I . 设 J '— f , , 证明 I sa^ -i-ta^ | 2 = I sb ：i +tb A j 2 , 因而对 

所有 . i , /6(；有]?6(^[£^ 1 (—办,人])= 0.若 推出 a , 

10. 证明， AeAi 是 Hennite 矩阵，当且仅当 /A 是斜 Hermite 矩阵.证明，一个斜 
Hermhe 矩阵的各特征值都是纯虚的，而一个斜 Hernute 矩阵的平方的各特征值是非正实数. 

11. 如果 A , 是矩阵，证明 t r ( AB ) 2 < t r A 好.提示：证明 Aij — 是 

斜 Hermite 矩阵，然后考虑 ir ( AB — 

12. 如果 AeM ,, 是 HemiUe 矩阵，证明， A 的秩 等于六 的非零特征值的个数，但是对于 


非 Hermite 矩阵一般不成立. 



13•若 A 6 JH , 是 Herrnite 矩阵且 A 其0，证:明 
_ rank(A) > 

上述等式成立当 ti 仅当#在一个具有标准正交列的矩阵17=[ 1< ,‘..《,]6队/和某个 £ (611使得 
A - uUU - ； 即 A 是一个西射影的实纯置倍数. 提示： 若 Al , …， 2,是欠的非零特征值， 
Cauchy-Schwarz 不等式 是说： 


, ftr Aj ! ■=- (^ A ,)" < ^ rlr A ", 

其中等式成立当且仅当所有 A , 相等. * l_l 

U . 斜 Hermite 矩阵 A 6 JW „ 满足恒等式 A = - A *. 如果托 R , 证明， A ^^ A ' ,当且仅 
当 f &’A 是 Hemiik 矩阵.对于 fl =7 T ， 这是什么？对化 二 0呢？说明为什么斜 HermUe 矩阵类 
可以看作“广义 Henuite ” 矩阵的无限多个类中的一个，并且描述每一个这样的矩阵类的结构. 
1 S . 设 Hermite 矩阵 A =「 a „] eR 已写成如卜的分块形式： 



其中， - rec 1 AGM ,,-!. 证明 

det A = (Jijdet A - j- " (adj .A).j- 

其中 adj 3 是 S 的经典伴随[见 （ OJ . 2)]. 使 A 满足更弱的什么条件就能保证这个公式成立？ 
提示： 按 A 的第 1 列进行行列式的】 . anb ce 余子式展开 （0. 3. 然后对 所得到 诸余子式的第 
一行进行展开. 


4.2 Hemnite 矩阵的特征值的变分特征 

对 r _- 般的矩阵 AeM „, 关厂持征值的唯一特征是.它们是特征方程 PA ( r )--0 的根.位 
诘.对丁 • H ( _'rmite 矩阵. 特征值可以表征为.系列最优化问题的解. 

W 为 Hermiu 、 矩阵 A 6 M ,, 的特征值都是实数，我们将约定，它们将按其大小递增（不减） 
顺序# 列： 
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A ml „ = A[ < A 2 < … < A„ 1 < = A m „. (4. 2. 1) 

很容易把最小的和最大的特征值描述成约束最小值和约束最大值问题.下述变分特征定理冠上 
了两个英国物理学家的名宇，并且称 X * A ^ /乂 为 Rayleigh - Ritz 比. 


4. 2 . 2 定理 （ Rayl 啪 h - Ritz ) 设是 Hemiite 矩阵，且设 A 的诸特征值取 U . 2.1) 中的顺 
序，那么 

e c •成 立； 



A „„„ = Ai = min s — min Ar . 

-r -J iW 

证明： 因为 A 是 Hermite 矩阵，所以存在酉矩阵 L 7 e M „ 使得 A = [ MU ' ，其中 A = 
diagCA , , A e , •••, AJ . 对任一: r & C "， 冇 

， Ar= ^UAU^ = (m(LT x ) 

=SA, ] ([/’ 八「 

由于每项 I ([ JV ), I 2 是非负的，于是有 

I ( U .;), I 2 < U \ r ), 2 I ([尸八 l : . 

因为 (7 是酉矩阵，所以 ^ " 1 

S I (m , 卜丈 u p = ：^， 

因而我们已经证明， ' 

^ J - = ^ x j H Ar ^ A = A n ：r (4.2.3) 

因为，如果 t 是/ \ 的相应于特征值 A ] 的特征向量，那么/ Ar =，An = A ,： rV ， 且对于夂也 
有类似的结果，因此，这些不等式可取等式.其余的论断容易从 a 2.3) 推出.如果 r 矣0, 
则有 


当 X 是 A 的相应于 A „ 的特征向暈时，等式成立，因 ilij 

臟 £^£ 4 . 


最后，如果 ： T 关0,则有 




因此，条件 (4. 2. 4) 等价于条件 


〆 Ai . 二 


U . 2 . 5) 

□ 


关于 L 的论证是类似的. 
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(4.2. 5) 的 几何解释是， 当 取遍 C " 中的单位球（它是紧集）时，函数， Ar 的最大值是 
A„. 的取值范围 （1. 2. 3) 则给出 r 下述特征值包含结论. 


4.2.6 推论 设 AeM „ 是一个给定的 Hermite 矩阵， C " 是一个给定的非零向量，又设栏 
那么，在区间（一 ™， d 中至少有 A 的一个特征值，同样在区间 [ a , ^«)中也至少 
有 A 的一个特征值. 

练习证明推沦 （4. 2.6). 

练习关十 Ai 的类似于 U . 2. 5) 的结论及其几何解释是什么？ 

Raylcigh-Rhz 定理给出了 Hermne 矩阵 A 的最大特征值和最小特征值的一个变分特征， 
然而，其余的特征值又怎样呢？假定 A = RU = U , « 2 , «„], U 的诸列是 A 的 

标准正交向 M. 如果只考虑与…正交的那些向量 .reC 1 ， 那么，对在 （4.2. 2)证明中的主要恒 
等式，应做如下修正： 


Ar = I (U.，), | ; = I “ 二 ■ |2 = 2 义 < I «,- r I 、 

r- I [=1 ； =2 

这是 A 2 , A s ，…， A ,, 的 个凸 组合，因而，只要 I 与1/的第1个列向量 I 交，就有 

? Ai- = I u " ^ I 2 S 夂公 I l z = L 士 I ([/V), | : =■ Aw*i. 

如果取这个不等式就变成等式，于是.有第二个最小特征值的一个特征 


, r J Ay 


练习试推广上述 i 仑证，进而证明 
■ - r * Ax 


Ax = X ' i , 


At = At ! 


2,3, 


(4.2.8) 


练习证明 


i〆 Ar = 


:* Ajr = X^k j k = — ]. (4,2.9) 


遗憾的是，这些公式的实用价值不大，这是因为它们要求明确知道某些特征向 M ， 而通常 
又没有这方向的信息.何是， U . 2. 7) 以及相又的公式 （4.2. S ) 和 （4. 2. 9) 可以作为 推导 ； h t 个 
有用的特征的出发点.是给定的向量，那么 


; upx * A ; = . supx - U / lt；'.r = sup ^ A , I U ' j -), l E 

、 =i r \ 1 I \ ] J =] 

「 J U _ J ■丄 U j 丄 

=sup 2 A ' I ^ r = sup j |- 


> 111 2 


\m 
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= sup I 之『] 卜冰 I & > A 『 i. U. 2. 10) 

V] 1 - 、 1 、卜 1 

在上述第二行论证巾，令 a 用到 r 以下 事实： 如果 ^ i = i , 那么 t / 是两矩阵可推; jj 
^*^1. 上述第一个不等式从以下事实得 来的： 如果缩小某集合，然后在其上取上确界，则 
上确界的值不会增加.最后一个不等式是从次序关系以及常用的凸组性质得来的. 

在上述论证中，向是固定的，但又是任意的，因而可以在所有 W 上取 （4. 2. 10) 的下 
确界，这便得到 


inf sup 1 Ar 5= A„ i. 

cf -r j = 1 

但是，如果災=-‘，则 （ mo ) 中等式成立，内此有 

inf supx * Ax ^ A tJ _" 

- LLt " C ri l 

这个在形式上比 (4. 2. 7) 稍微复杂一些的特征并不需要知道 A 的任何特征向量.因为 
时冇/ Ai - sA ,,-! ， 所以常常看到这个公式用 “ max ” 代替 “ su〆 ’， 用 “ min ” 代替* ‘ inf ”. 这是 F 述 
Cuurant-Fischer “极小一极大定理”的基本思想. 

4 . 2 .11 定理 （ Courant - FisrheiO 设 A 6 M „ 是具有特征值 A , … 的 Hemiite 矩阵，左 

是给定的整数，那么 


lUE 




r x 

(4. 2. 12) 


a 义 13) 


附注如果在 U _ 2 . 12 〗 中6二《，或在 （ 4 . 2 . 1幻中6=1,约定去掉在外侧取极小或极 
大过程，因为这时取梃小或极大的集合是空集.在这两种情形.上述结论简化为 


Rayleigh-Ritz 定理（4, 2- 2). 


证明： 我们只考虑 (4.2. ]2)，血 (4. 2, 13) 的证法是类似的.把 .4 写成 A=LMLr ,其中 L ； 
是 W 矩阵， ( fif A - diag ( Ai , A ,, AJ , 且设 如果 则 

■ r * Ar = (UVr A ( L 7\ r ) _ (17' j -) J A ( tJj ) 

且 (H ■ reC " 且 x 关 0} = bf C ": y ^ O }. 因此，如果给定叫 ，叫 ，…，便有 


■sup 




y ■ Ay 

y\y 


i C 

>，〉■=] j =•: i 

> i L 't r ^. t， 

su p ^A r I i- 

丨 I - [ 
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这说明， 



5 丄 L’iv 】 ， … .U« s . A 


对任意 n-k 个向量叫， u> 2 ，…， vu n k , 


sup 

j^o jr jt 

- …，〜 

ini(4,2.9) 说明，为使等式成立，诸向量叫总有一种选擇，即叫二〜--…，其巾 [7=[ W| “W„]. 
因此， 


- r ^ Ar . 

tnf sup 一― •, 一 — X k , 

江 .〆”，-〜•* JT X 

:>]' J，，fll V i 

乂因为极值是可以到达的，故可以用 “ min ” 和 “ max ” 代替 “ inf ” 和 “ sup ”. 关于 (4. 2. 13) 的证明是 
类似的. □ 

练习 给出 （4. 2. 13) 的详细证明. 

习题 

1. 设 A 6 M „ 是具有特征值 A ! 的 Hermite 矩阵，试利用 （4. 2. 11) 证明 

x * 

A* — min max ； — ，办 =1 ， 2 ，… 

』 x 


Ai = max min k = 1,2, 

在这两个式子中， $ 表示 ; '维子空间，其中在外侧取极小和取极大是对所有指定维数的子空间 
而 H 的. 

2-如果是 Hermhe 矩阵，证明下述三个求极大值的问题有相同的解： 

<a) max/A』， 


(C) max 4 - - 如果 *4 至少有一个特征值是正数. 

3- 如果是 Hermhe 矩阵，且/ ： r = l ， 证明 

Ainfl.'t -i ^-X Anuii- 

4 •通过考察 A=j^ 来说明，在 （4.2.2) 中，关于 A 是 Herrmte 矩阵的假定必不可少. 

maxUMj'/j'i : O-h 七 R] 等十什么？ max Re{ ^ " Ajc/j x : 0 尹 ^6( ： ] 等于 什么？ 

5 .设 A & M „ 有 特征值 U ,}. 证明，即使 A 是 Hermite 矩阵，其特征值也有如下界限： 

提示：取 I 为叉的--个特征向量_ 并且用 U 说明上、下两个界都是可以达到的. 
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4.3 变分特征的某些应用 


在 Courant - Fi ^ cher 定理的许多電要应用屮，最简单的应用是关于 A 卄 H 的唐特征值勻 A 
的特征值的比较问题.我们用 1( A ) 表小矩阵 A 的诸特征值. 


4- 3.1 定理 （ Wcyl ) 设 A . BGR 是 H er mite 矩阵，乂设诸特征值 A , ( A ), 1,(丑）以及乂,（4一 
川均按递增顺序 （ 4 . 2. 1) 排列.则对每个4 = 1，2,…， n , 有 

A ( A )+ A ,( B ) + < A *( A ) 丄 A „( B ). U .： i .2) 

证明： 对 T 任意非 . re < T ， 有不等式 


晒 


< 


因而对任意6二1,2，- 
A t C .4+ B )- 




(A + B)jc 



min max I ^ ^ l~Ai(ii)]=Aj(/\)+A,CB). 

类似的 i 仑证同样可以确定它的上界. 1 n 

练习 说明在 ( 4 ‘ 3.1) 中给出的界屮可以取等号. 提示： 设 U ,， ^，…， 《„ j 是由 A 的特 
征向量组成的标准 j 下交组， n . Au ^ axa )^. 分别对 c > o 和^<0考察 R = au , u ；. 

Weyl 定理 对任意 Hermite 矩阵 A 和 B 给出广 A+B 的特征值的 h 界和下界.如果限制 H 
具有一种特殊的形式，例如 B 为正定矩阵、秩1矩阵、秩 i 矩阵或加边矩阵，还可以得到更为 
精细的表述. 


矩阵肝财,,称为半正定的，是指它对所有 k C « 有，办> 0 .—个等价的条件是，只是 
Hennite 矩阵，且所有特征值都是非负的（见第7草）.下述结果是 Weyl 定理的直接推论，称 
之为单调性定理，它说明.如果一个 Hermite 矩阵加上-个半正定矩阵，则它的所有特征值都 
会增加. 


4 .3,3推论设 A，BGAi, 是 Hermite 矩阵_假定 B 是半正定矩阵，民.4和/\十月的诸特征 
值均按递增顺序 U. 2 . 1) 排列.则对所有 A = 〗， 2,…， n. 

^ t (A) ^ : A t (A + B). 

证明： 利用 (4.3.2) 中的下界及 A,(B>>0 的事实. □ 

如果矩阵 B 有秩〗，那么用力的特征值作为 A+B 的特征值的界具有 交错定 理的形式：在 
/1 + B 的每对相邻的单号数(或双号数)特征值间至少存在 j 的一个特征值 ■ 

4.3.4 定理 设 AeA^.Hermite 矩阵，是给定的向量.如果 A 和 A ■的诸特征值 
i ] M 均按递增顺序 ( 4 . 2 . 1 ) 排列，则有 
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(a) 士之 〆 ）<； Uh ( A )< 夂)，点=1， h …， ”一?■， 

(h) KAyH L(A 士 zz* )d+y(A ) ，走 —K 2 ， ■+.， n~2. 

证明： 设 2, 利用 (4. 2. 12) 可导出下述关系： 


Xi-z(A± zz* ) — min 

u .i ’-卜斤 


r* (A 士以 • ）丄 


》 min 

lJ .i _.，■' * 


max 

W 1p 


， （A 士 ;^ ):r 

X ' JC 


— min 


I t - ^'r, ( L^ C， ' 

一 A^+i (/ \) * 

现在设 - 丨，利用 （ 4.2. 13) 可以诂出下述关系: 


x * Ai 
,r \r 


:-， 丄 V.i 


A* (A 4 - ^ * ) = max 

'■■' -% , (z c " 


(,A_rb ).r 


^ max min 


( A.f zz * )x 


max min 

rlT( 「= t 


， Ar 

jc y jt 


j. - 

^ max min —— ; —土 UA), 

合并这两组不等式，由此得到所要求的不等式组. □ 

如果 BeiW „ 是一 t Hermite 矩阵，11 ,其中，〜 ... ti ,,] 是酉矩阵， A 二 

山叫 ( A , 择.…，庠），则 B 的秩等于非零特征值的个数.如果 B 的秩小于或等干「，则可假 
定尽一 0. 如果 秩小丁 r , 则戽.角，…，/3,含有某些为零的特征值，表小式 

B - }Jgu,u ； (4.3-5) 

是表示 B = [ MU - 的另一种形式.反过来，形如 （4. 3. 5) 的枉何矩阵，只要所有兵关0且 U ,} 是 
无 关组， 那么它就有秩 n 如果不知道 U ,} 是否无关，那么 S 的秩至多是 r . Weyl 的下一个定 
理给出 T 当 B 有秩 r 时 A + B 的诸特征值的界，它来源于积 分方程 理论.本定理是 （4. 3. 4) 的 
秩1情形的简申推广. 

4.3.6 定理 &A, B 6 M ,, 是 HermiTe 矩阵， 并 且假定 B 至多有秩则 

( a ) A*(^+B)<A t+r (AKA i+Zr (A + B), k = l, 2, , n -2r ； 

( b ) AtCAXAi .^ A + BXA ^+^ CA ), k = i , 2, -, n ~ 2 n 
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( C ) 如果 A = U 7 l (7*， 其中，是酉矩阵 ， A = difig ( Ai ， 夂 ） ，目. 
+ 乂如果 

^ — A/jW TJ w rJ H - Aw— ] tin- l 广 ] - 1 - * * * H - A h— 叶 i Utf-i^- ] w tJ —I 一丨， 

则 AnuiJA — iJ ) = A n , C A ), 

证明： 设 B = aiUl W + … ， 其中集合丨《, ，…， >0匚 C " 不一定无关， （ a ) 和（ I ))的 
证明恰好与 H . 3.4) 中 U ) 和 （ b ) 的证明相同.只是 在前面 放上一个条件 “. ilz ” 的地方，现在加 
上/■个条件并完成相应的论证，关于 ( c ), 注意到 Ml ，…，都是 A - B 的 
特征向量，但是对于 A 二” ■ r + 1 , n — r + 2. ■•■ , n , (A — B ) u s =0, 而对于 6=1, 2 .…， 
n — r , iA - B ^ u ^ X . u ,. 因为 V 所以 A-B 的最大特征 值是; □ 

练习给出 （4. 3.(5) 中的 ( a ) 和 ( b ) 的详细证明. 

上述结果所提供的足够信息，使我们能够推导出 Weyi 关于两个 Hermite 矩阵之和的特征 
值的下述•般结果. 

4.3.7 定理 ( Weyl > 设 A , 是 Hermhe 矩阵 ， R A , B 和 A + B 的诸特征值按 （4. 2. 1) 

的递增顺序排列，那么，对于便得1<厂且厂卜纟>«+1的每对整数 j ， 有 
A ” h(A + B ) < A ,( A ) + A *( B ), 

而对于使得1<), 4<«和7'+6<»十1的每对整数）.々，有 

A;(/U + A t ( B ) ,(A + B ). 

证明： 设厂 走是满足第一组条件的已知整数.设力=见（4)[；', B ^ VAiBW ' , 其中. 
L f = [« iu ；!.‘‘“„] eM „ 和 是两矩阵， A ( A ) = diag(Ai ( A ) , A „( A )) 6 M „ 

且 yl ( B )= diag ( A , ai )， …， A „( fl )) eM „, 因而 

= A„ (A)u„u' + A„ i ti: t + … + A,” (A),u； + [ 

的秩至多为 n—j , 十… 十 A *. 丨 （ B ) 叫- [ TV *! 的秩至多为 《 —A , 而 A, + B t 的秩至 

多为 2”--j — L 于是，根据 C 4.3. Sc )， a „(.4 —AJ = A ,( A ), A „ (_B — 氏） 一 A * ( B ), 再根据 
(4. 3.6 b ), L ( A - A J ^ rB - H ll )=^( A + B -( A J + B t ))^ X „ «„-厂*, (A + B ) = A ,+ ,-„ (A + i 3) (其 
中 k + r=n Kr = 2r>-j-k). 兒外根据 (4. 3. 2) 有 

A „ CA -+ B - iJ t )< A „( A - A J ) + A„(B — 认）， 

(其中 4 = 0. 因此.有 

A ,( A ) 十 1( B ) 二 a„(A — A :) + A,,(B — 执） ^ A „ CA - A , -?- B - B t ) 

=— ( A ) + B ,)) > A;+„(A + B )， 

这就是要证的第一组不 等式. 第二组不等式可直接由第一组不等式推出’只需把它应用于一焱 
和一 B 即可. 口 

练习试给出从 (4. 3. 7) 中的第一组不等式推导出第二组不等式的详细证明.搵示 ：利用 
(4.3‘7)得到七 + 卜/ —八一石)的一个上界，然后利用下面的事实：如果 A 6 M , SHermite 矩 
阵，则 A ,( ~ A ) = - A „- ,n ( A >. 

作为这种类型的最后一个结果.考虑关于 A + S 的特征值的交错定理，其中，假定 A 和 S 
中的每一个都具有特殊的形式.这个结果类似于 （4. 3 . 4 )中假定 B 有秩1的情形，称之为加边 
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矩阵的交错特征值定理. 

4.3.8 定理 设/^时。是给定的 Hennite 矩阵， CT 是给定的向量， a6R 是给定的实数. 
设,是在 A 旁镶 h ). 和 u 后得到的 Hermhe 矩阵，如下 所述： 

S A 和 A 的特征值分别用<九丨和彳 U 表示， H . 假定它们按递增顺序;和 
夂-:排列，那么 

Ai < Ai < X 2 d (… ^ A rr 1 < L < A, < Ah-i* (4 - 3. 9) 

证明： 设 々是 给定的整数，且我们要证明设 

〔 6 C ， 且 u ’] — [ WTii 」’ 6 C 、 vj , 6 C 1 1 ⑴ 6 C . 利用 CouraniiFisuher 定理的 


<4. 2. 12) 可导出 




A . 


^ y\x 


_〆 


关十 A 的 F 界，利用 （4. 2. 13). 


Ai ~ max min 


S：^ A.. 


Ai 


.wc〆 一 i f 




□ 


- ■'』.| •，.. €■ C N T^0,J 0 ff 

我们已经看到关于特征值的夂错定理^两如果给某个 Hermite 矩阵加上一个秩 
lHermite 矩阵或者通过加迓造出一个新的 Hermite 矩阵，那么新旧矩阵的特征值必定交错. 
关于它们的逆命题又怎样呢？如果给定两组交错的实数，能否造一个 Hermite 矩阵，以及一个 
对它作了适当修改的矩阵使得它们分别以这两组交错实数为其特征 值呢？ 回答是肯定的.作为 
例于.我们给出定理 (4.3. S ) 的逆定理. 

4.3.10 定理设《是给定的正整数，且设 

{ A , : i - 1,2, •■•,«} 和 U , :丨=1 .2, …， 7 i， n + 1} 
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画 


是适合关系 

Ai ^ Ai s £ As < A2 …1 A „ ^ A „ 1 
的两个给定的实数序列.设 A^-diagUu A z , …， 夂）. 则存在实数 a 和实向量 ye R ' 使得 
U , , A ,, -, 是实对称矩阵 

“ m „„( r ) 

的特征值集合. 

证明： 砧然 U , A 2 ，…， U 是 A 的特征值集合，乂因为 tr ^\ = trA + a , 我们必定有 a = 

trA - lr ^= SA .-^ A ,. 计算 A 的特征多项式>；；是容易的，这是因为 

- [tl - A - y 1 

det (" - A ) = det [ - j j 


— 」「 ? : oir/J-A ■ - j ir; w— a)_V 

— e 吃 [("— A )- 1 }]、： 1 」L — / f i 」[_ 0 .. r ………丄……-…- 

= det [ n : .?.1 

L 0 . (n) —y 

=Lit - a) y r (tl — A) _1 3 ']det(// — A) 


=[( f - a ) … ^ y ]] JC /- A ,) - p \( t ). (4.3.11) 

我们巳经确定 了值〜 因此，剩下要证明的是，《个实数 y 可以由 （4. 3. 11) 来确定，使得对 A 
= 1.2，.--, n \ \ti pl ( L )~0. 


定义多项式 

»+1 

/⑴= JJ (; — i ,), / 的次数 = /) + i , ( 4 . 3 . 12 ) 

1 \ 

H 

〆 ?）= "[ I(f - A ,)， 旦的次数= ”. （4.3.13) 

根据 Euclid 算法.一定有 !_1 

/( f ) = — c ) + f it ), 

其中， t '是实数，而 Kf ) 是次数至多为1的多项式，通过直接计算，求得 t . = f ； i , … ^ A , 

r= ] r 1 

= u . 另外，因为 ff ( A f )=0， 所以对于々=1， 2, …， n ，/( A t ) = ff ( A *)( A t —«)+ ra .) = r ( A *). 
因此，就知道了多项式 Kf ) 在 ”个点 的值，如果插值点 A , ，…， A ,, 是互不相同的，则可以 
用 Lagmnge 插值公式明确写出.在这个假定下， g ( f > 只有宇.根，因而，关于 r ( f ) 的 L agrang e 
插值公式是 


于进， 


r(f) = 公 /(A,) 

t 


g (0 




U_r “）十 


rU ) 

gU ) 


U -^)-2 
! -1 


— f ( X t ) 1 

" Za ) 
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因为 • 对所有 >二1， 2. 


"十1, /( A ,) = 0. 就必定有 


2 


7 U ) 


= 0 , 


—1,2 ，…， /H 


(4. 3. 14) 


8 (AJ A * 

我们肴到，如果对/ = + ] 或々有 l = A ,. 则相应的项 l/(f - A ,) 有零系数，因而在 f = A 时不 

会有奇异性.如果对 — 1，…，可以命乂三一 / a )/|/ a ), 那么 （4. 3. 11) 保证二 
0. 厂是就完成/证明.因此我们必须证明. fi ^ y / g ' d ,)<,(), r = l , £, 而现拃该用 

交错性假设了.利用和 # f ) 的定义及交错假设，得知 




/a) = c- 1 )'" ! JJ I 九 一 < I, 

因时 /'( A ,) 和 /( A ,) 总有相反的符号. ' 

不难修改上述论证以适用于有些 A , 项相等的情形.例如，如果对某个有 A , = A : = 
■，则夂广 A ,. (-1.3. 12) 中的多项式名（/)冇因子 U — A ,)( ; — Ad *. 1 ; 
U .3. 13) 屮的多项式 Wf ) 冇因子 （/ — L /，1 U 恰好是 At 作为 /( f ) 的零点的重数.因此，可以 
用 (/— 1 除/⑴， S ⑴和 K /) 来修改这每一个多项式.修改后的多项式⑴将以 A , 作为其 
申 E 零点.如果继续用这种办法取消 g ( f ) 的所有重根，则证明可以如前继续下去，且结论是 
相同的. □ 

上述各个结果讨 i £ r 在.个 Hermite 矩阵旁“镶”上新的最后一行和最后…列的情形，但是 
这也町* 成进给 出 r 当把.个 Hermite 矩阵的最后-行和最后一列划去后其特征值的变化信 


息.当 然最后 - •行或--列并没什么特殊的.在 （ US ) 中，如果划去矩阵 A 的第！行和第;■列， 
是第 U 1 ] )行和 U +1) 列，那么在证明中，只是使变成 f | , 并 K 得到相同的交错不等 
式组 （4. 3. 9). 

把定理 (US) 与 （4. 3. 10) 合在-起就说明，交错不等式组 (H 9) 是 Hermite 矩阵的诸特 
征值与它的任一 n — 1阶主子矩阵的诸特征值之间的相互关系的一个完整的描述.如果间时考 
虑4的所有《个(《— 1)G_ 1) 韦子矩阵，那么坯可以多说几句.设 A_ 表示划去,4 的第 j 行和 
第 J 列后得到的主子矩阵 . ) = 1 , 2, 「L 设 A 和的诸特征值按递增顺序排列.对于 

每个卜 -1， 2- …， n — 1, {[ 




和 


min 入: （ A 《- — - A , ( A ) + — A ,；( A ) t 

n rt 


■ ( A ,) 之 （' 2 ) [ A „(.4 j — Ai </\)]. 


如果 A 的所有特征值非负，即如果八是 半正定 矩阵，那么由这三个不等式中的第―个推出， 
至少冇一个主子矩阵 A,, 可使 
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A„-1 (A,} - - — -A „ (A), 
n 

因此，半正定 Hermile 矩阵的每个主子矩阵的谱半径不会“很小”. 

人们可能希镇从…个 Hermite 矩阵中划去若 T 行和若 十相应的列，余下的矩阵是原矩阵的 
-个主子矩阵.下述结果可以通过重复应用交错不等式组 （.1,3. 9) 来得到，但是从 Coumnt - 
Fi . scher 定理 fl 接证明 这个论断 也一样容易.冇时称这 个 结果为 包含原理. 

4.3.】5定理 SACAl 是 Hermite 矩阵， r 是整数. l « n , 又设 A , 表示（从 A 中划去 n — 
f ■行和相应的列后得到的)/\的任 -. rXr 主子矩阵.哪对于使丄； SXr 的每个整数 〖，冇 
通 A,(A) <^(-4, ) < A ( -,^,(A). 

证明：假定 / IGAt 是从 A 中划，.‘ .， 〜.行和相应的诸列 B 得到的，且设 
利用 （4.：；. 12) 可导出 


At -" f ( A ) ■ 


> min max 

u 、 ， ‘ ‘U r * W ( 




KA 「）, 


假定再利用 （4.2. 13) 可导出 

( A ) ^ max 


r Ar 


— J ： ' At 


I r-=",. 1 ^ r 




々（ A ,). 


定理 (■!. 3 . 15) 的下述简单推论称为 Poincar — 分离定理.它可以应用于（像量子力举）那样的 
场合，在那里人们有关于内积 <.4«,方面的信息. 


4. 3. 16 推论设是 Hermite 矩阵， r 是适合的某个整数’设〜，…， 

屋 r 个给定的单位正交向量，设如果 A 和队的 诸特征值按递培顺序 
(4.2. 1) 排列，则有 

A*(A) < A s (i!「） < 义 ( 一 „?(A) ， 石 =] ， 2 , ( 4 . 3 . 17 ) 
证明： 如果 f < n ， 另选 r r 个向量 u — 〜使得 {«, ，…，„ ，，^ ，…，是标 
准正交组，设…， ujeM n . 矩阵17是酉矩阵 ， LT 与 / i 有相同的特征值，而已 
2 M ] 知矩阵认是划去最后？!一 r 行和列后得到的 [/. AI 7 的主子 矩阵. 现在，论断可从 （4. 3. ]5)得 
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出， □ 

在上述结果中，矩阵可以写成 L 7' AU , 其中 是有； ■个单位正交列的矩阵， 
因为 U fi r - A .< B ,) + -+ A f ( B r ), 所以，下述极值特征可以通过相加不等式 (4. 3. 17) 来得到. 
4-3.18 推论设 A 6 M ,, 是 Hmnite 矩阵， r 是适合的某个整数，那么 

A [(.4) + hA r ( A ) = min tr U ' AU , 1 (4 3 19) 

a \ueM„, r . . 

A „ ，.- ,( A ) +-+ A „( A ) = max irU ' AU , j (4.3.20) 

I" [，一 it M, 

如果 L； 的诸列选为 A 的 r 个最小特征值的相应单.位正交向量，则 （4.3.19) 中等式成立. 
类似的选择推出 U. 3 . 20) 的等式成立.这两个不等式可以看作1^71 & 41 1 -[?心定理(4.2. 2) 的推 
广.它们可以用来证明许多其他有意义的不等式. 

有时，我们知道.一.次型， A_r 在一个子空间上的变化范围，把 Couram-Fischer 定理用于 
这种情形便可以给出 A 的诸特征值的界. 


4-3.21 定理设是 Hermite 矩阵，是是适合的某个整数，设 A 的诸特征值按 
递增顺序 a 2 . n 排列，且设氏是 c " 的某个々维子空间.如果存在常数使得对所有 
S * 有， A ： r > [2 K ； r ， 则;…如果存在常数 C| , 使得对所有有 


证 明：设 


土是张成 S 士的 A 个单位正交向利用 (4 2. 13) 可导出 








久 『川 _ 


类似地，可以利用 (4. 2.12) 导出 






□ 


4.3.23 推论如果 AE / W n 是 ffemhe 矩阵，且对是维子空间的所有向 M i 有 i ，如 >0,则 
A 至少有々个非负特征值.如果对 A 维子空间的所有非零向量有 _^ A _ r >0, 则 A 至少有点个 
正特征值. 

证明： 第一个论断可由上述定理推出，只需取 q = 如果 ^-^=0, 则不等式 （4. 3. 22) 

说明 


sT X 


但&是有限维的，所以集 D = U ' eS * : 1；7-1}是紧集[见（5.5.6)]，因而连续函数 f A _ r 对 
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某个满足 i 的达到它在 D 上的极 小值； 特別是然而， X ； A . r.,-0, 这与 
当 xeS* 且 x 乒0时有， A_r>0 的假设相矛盾. 口 

Hermhe 矩阵的诸特征值和诸主对角元都是实数，且诸特征值之和与诸对角元之和（迹」相 
同.诸主对角元和诸特征值间的明确关系可用优化概念给出. 

4.3.24 定义 = 和 j3=[/3,]eR" 已知，如果对所有 A = 1 ，2 

min| 2久： 1 < …。 min { 2' -A d < …< h ^ ^* 

； - l ?=I 

且当 & = » 时等式成立，则称向 Mj 3 优化向 Ml 如果按递增顺序％ ^ < 

良 2 排列《和 J3 的各元素，则定义的不等式组可以表达成等价的形式- 

t =[ i 

_ 它对所有6=1，2，…， f! 成立，且等式对6 = /!成立. 

因此，实向童0优化实向量《，是指对2，…，«-1, )3 的 A 个最小元素之和大十或 
等于《的6个最小元素之和，且;3与《的各元素之和相等.应指出的是，可以任意改变 J3 与 a 
各元素的顺序，而不影响月是否优化 a. 

优化概念是在矩阵理论的许多场合中作为两个实数集间的确定戈系产生出来的重要概念. 
这种情形的一个例子是下述 Schur 定理 （1^3). 

4.3.26 定理设是 Ht’nmk 矩阵，则 A 的济对角元组成的向量优化 A 的诸特征值组 
成的向量. 

证明： 证明是对维数作归纳法.对》=1,没有什么可证的，所以，假定结论对所有 
«—1 维 Hermite 矩阵成立.设 A = [a w ] tE M, 是给定的 Hermite 矩阵， R 设 A,eM„ i 是划去 
对应于 A 的最大对角元的行和列后得到的 .4 的主 f 矩阵. 设是_4的有序特征值， 
!是八，的有序特征值，且设 是诸 对角元按递增顺序的重徘.根 
据归纳假定，对所有 （二 1，…， r; 一1，有 

> SV . 

因为交错性[定理 a3.8)], 还有 

A, < A, 4；… (Ah & A„, 

因而，对所有 6=1 ， 2, +■■, n— 1，有 

厂 -1 j=i 

因此 

y , j ^ 1 々 = i — i ， 

;'1 11 i =\ 

乂因为迹是所有特征度的和，所以等式对 A = » 成立， □ 

_ 优化概念也可以用来表示矩阵之和的诸特征值与其被加矩阵的诸特征值间的艾系. 
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4.3.27 定理设 A , 是 Hermiie 矩阵，设 A ( A ) 二 「 A E U )1 ， A ( B ) 二和 A(A 十 

B)=[AJA + B )] 表示 R " 中的列向量，它们的诸分量各是按递增顺序 （4.2.1) 排列的 A , B 和 
A + B 的诸特征值，则向量 A(A + B ) 优化向量 A ( A )+ A ( B ). 

证明： 則任意々=]，2,…，利用 (4-3. 18) 可导出 

(A + B ) = min trt /+ C 4 十 B)Li 

f- J V" l : Fc M t 

- min ( trU'W + trLT BU ) 

h * JVJ^ 

在 min trfr/U ； 十 min irV* BV 

i-" t;=i … l :，Ke % 

t * k 

- 十 XJa / b ) = XI a ( a ) + a ,( b )). 

I l .=1 r 1 

W 为 tr ( A 十 A~Hr H , 对于6 = ,!， 等式成立. □ 

我们已经说过，优化是 Hermite 矩阵的诸主对角元与它的诸特征值间的 一 个确定的关系， 
讥 是，在 （1.3. 2 S ) 中 K 是建立起这种关系的一半，为/证明另一半，需要下面的技巧性引理. 

4.3.28 引理设《>2,且设 ai < 0 」< !和戽在洚 < — 是给定的实数.如果向量 /；--= 

[ A ] 优化向 M « = [«」]*则存在》 -1 个实数 h ，… . y „ !，使得 

a ! ^ 7 i =Ss 0f2 < y ; < C(j < a ,,- [ d , 1 a „, 

11 .使得 〆==[/?■，...，/I J^r 1 优化7=「7 ,,…， L leir - 1 . 

证明：如果 r ! = 2 ， 则有 ai < j 9] 且 ai 丨 a ! =戌丁氏，或 

«2 = (^1 — a! M ^ / J z /?! . 

所以，因而可以选取 y , 二焊且 适合所述条件.现在假定》>2,且设 d ={[^， …， 
^- i ] r ^ R " 1 表 i 用不等式组 

«[ < < a , , U . 3. 23 a ) 

y . i 

H 8 ' < Si 3 ^ 6 = 1-2 ，--.h —2 a. 3. 29b) 

i~l 广 I 

定义的点集‘因为 0 优化 a ， 所以点，…， ] 7 总在 d 中，因而集 A —定不空 . 4 显 
然是有界闭集， u 容易肴出它是凸集.如果5=3,.…，九，] ; 64,则定义 /«)=&+ 在+… 
+ &卜注意 ， /(aO =〜+… + a „ + '--+^,- l . 如果能够证明有某个占64使 /( 幻 > 
负■(… + A -]， 则根据 △ 的凸性，对所有 ； e 「 o ， 1」，将 有心十 （ i — 并且 
(1 一;) 幻将是适合 

发(0> ^ +/3 『i > ^(1) 

的连续函数.由此可以得出，对某个1」，有只 .(〜）=/?] 十— 卜成― 点 = = 

n — a , w 将适合所述条件. 

W 为 ./( _ ) 是紧集 Zi 上的连续函数，所以存在点使得 

max /(<?) = f ( S ). (4. 3. 30) 

我们要证明..… -f ! . 极大值点 Sed 适合不等式组 (4. 3. 29 s 和 b )， 因而 
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^ Ctrl t 々=1，2,…， /( 一 It (4. 3* 31a) 

k k 

< SAi k = 1，2，+. •，/ 3 —2. (4.3,31b) 

!=1 !=1 

如果整个不等式组 (4.3.31b) 是严格的，且不等式组 (4. 3. 31a) 中至少有一个不是等式，则 
§至少有一个分量还可以增大以使 /G) 的值相应增大.因为这与极值性质 （4.3.30) 相矛盾，所 
以得出所有不等式 (4.3. 31a) 必须都是等式， S ^ U ， as , a „] T , 因而/(幻=〜+… + a ,,= 

<oti + a z +…十 a ,, ) — a 〗 =(办 4. 译十 Hm = ( 與十…十戽 - 丨 ） 十戌 一 ai >(與 H 十尽-】 ） 十 

j3：-«i^i + -+A w 这 IK 是我们想要证明的. 

如果不等式组( 4 . 3 . Sib) 不都是严格的.则至少有 A 的一个值使等式成立.设 r 表示这种4 
值中最大的一个，于是 


I = ] ? ] 

k k 

2^' < ' k — r -\ \ —2. 

n ~95 l 根据在上一段中相同的论证，对（=?*十1，…，71—1，必定有 ^= di , i . 因此， 
fib) = (5 i 十…+反）+〈九11十…+§■„■-】） 

=( 沒1+…十 / i ) f ( a r -? + …十 a „) 

= ( 卢 1 + …+ 成 - 1 ) _f (ai +- h a„) — (oi H - 十 a r .j ) —（戸出 + … -f ^ t ) 

=(於 十…十木 ) 十 （办 4…十涔 ）一（a t 十… + a HI )— 〔如 ,十… 十风 -i ) 

=( 热 + …+/3„ |) + [(历十… )-( aj+ - +a rll )] + (庆 w 十…+汉） 

—( 心 +…+ 沭- 丨） 

>( 网十 …+ 心 -, ) + ( 典 +2 — 汉 11) I 尽 .2) 十 …+ ( 爲 一 戽 1) 

我们现在可以证明《.3.2(5>的逆命题广 - 

4.3.32 定理设《>1，且设〜和;是给定的实数，如果向量“= 
[«,] 优化向量义^以,]，则有实对称矩阵 A = [h]e/VUR)， 使得 a„= 屮对；=1, 2,…，„成 
立，且使得 U,} 是 A 的特征值集合. 

证明： 对《 = 1，论断显然成立，假设对至多有"一 1个元素的所有这些向童^和义，论断 
已经证明.根据引理，存在实数使得 

^ s^； ■** A, ] ^ y,^] ^ A„ » 

且使 〆 =[〜 ，…，优化; r 二 [7 J T eR ~' 根据归纳假定，存在实对称矩阵 B — 0,,]6 
使得 { y ,」 是 B 的特征值集合，且对/=1，2，…， n ~\ b a — a ! . 如果 r = diag (/ i ， 
y ” …， r „ ,) e m „ , ( r ), 则存在实正交矩阵 , ( r ) 使得 b = QrQ T . 根据定理 
C 4.3.10)， 存在实对称矩阵 

A ^ :] ew “ R)，.v e r ;, 1 , o e r . 
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A = 


它有特征值 u}. 如果令 

- Q 0 ]A[ Q . f 

-0 1」 Lo 

则 A 有特征馆 U」， 且有主对角元^ 
一 u „ [ +« = Ai H -- ；[„=〜 + …十 


「 Q 0 u「 Q ° i = Qy ]: r 

Lo 1J L 0 1 」 l(Qy) r a 」- 


因 IW. 


B 

-(. Qy )' a J ' 

,,, a . 但是，根据优化条件， tr A -4 
n . a 有符合要求的对角元. 


上述结果不仅完成了涉及 Uermite 矩阵的诸主对角元和诸特征值间的关系的推理过程，而 
且能够解释优化关系&身的儿何意义.双随机矩阵 A6M„ 有77 : 个非负元，且每行和每列的诸 
元之和是 +1. BHkhoff 定理 (8. 7.1) 保证每个双随机矩阵是有限多个置换矩阵的一个凸组合， 
反之亦然. 


画 


4.3.33 定理设 f k ] eR " 和; 5=「/3 ,；^ir 是两个给定的实向量，则下列条付等价 ； 

( a ) jS 优化 or ; 

( b ) 存在双随机矩阵 seM „ 使得 

.Y V 

(o e (' 2 } ，其中 1 < w <⑴ . 丸 >. o , 2>, = 1，而' e R " 是-•个向 M ，它的诸分 

t-3 j，i J 

量是已知向量《的诸分 it 的某个置换. 

证明：如果假定 （ a ) 成立，则根据 （4. 3. 32), 存在存主对角元/>„二/9,和特征值 M £)=«, 

的实对称矩阵.根据谱定理，有酉 C 甚至实 1 F _ 交）矩阵! 7= L «,,」 CM „ 使得 B = ,其屮4 = 

dmg ( ffl ，…， a „), 而考察 B 的请主对角元可知办二其屮 S '=[~]6 M „ 是由 | 〜I 2 
给定的.闺为 (7 的每行和每列是单位向量，这个 S 的每个行和及每个列和都等于1，所以 S 是 
双随机矩阵（称这个特殊形式的矩阵为正交随机矩阵），这就证明丫 （ a ) 葙涵 （ b ). 

( b ) 蕴涵的证明在本节末的习题9中概述. 

如果假定（1>)成立，则 Arkhoff 定理 ( S . 7. 1) 说明， 

、. V 

S - YlP . P ,, 其中 二1， 

!_=] 

而每个 P , 是置换矩阵.因此， 

S \ 

jH = Set — L p t P , a ^ P 〜' ，其中 a e a ff + 

} 1 ! J 1 _ 

这个恒等式也证明了逆蕴涵关系. □ _ 

这样一 来，由某个向景 「沐， …，优化的所有向…，组成的集合， 

可以先计算出"！个向域然后作这些向量的包来得到，而这 d 个 AM 是采川货换向量的,， 

个分量的办法得來的 （ 当然，如果诸项汉不全不 R ， 则这些向 tt 也不全不问）. 

附注虽然一致赞同优化这一基本概念是很 f 要的.但采用的记号常不一致.有些作 
者用 U . 3. 25) 中的反向不等式定义优化.而有些作者定义优化是按递减顺序排列两个 
集合.因此，当人们从不同的文献中采用或引用有关优化的结果时.一定要倍加小 
心.参看习题11中促使我们选择优化定义的理由. 
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习题 


1. 我们知道，矩阵4 6 JW,, 的 谱半牦 是数值 

jo(A) = maxi I A,(A) | }. 

设 A, BGM,, 是 Hcrmhe 矩阵.试用 Weyl 定理 (4. 3. 1) 证明 

A ^ iJ ) CA t (A + B )— A t ( A ) 

因而，.对所有6=1 , 2，…，71有 

I A 4 (/W ii) i<p(B), 

这是关于^^1^扣矩阵的特征值的扰动定理[参看（6.3)]的一个简单例子. 

2. 试说明仅利用定理 (4. 3. 4) 证明中所导出的第-组不等式如何得到定理中所确定的所有 
不等式，提示： A=(A izzz ' ) Ts?* . 

3. 洋细证明 （4. 6b) 等价于 （4. 3. 6a). 

4 . Weyl 定理 （ 4 .S.7) 的 iiH 明中只用到丫不等式 ,( A), 其中 B 至多冇秩 r . 
证明这个不等式无须利用 Uouram Fisrher 定理，而是用需要提供洋细论述的下述论断.假定 

并且设 A = [ MtT , 其中[…… 《„] 是酉矩阵.则存在 r +1 个纯 
量 , ， a„- r . 1 , ■•- 1 . 使得对所有? '= 1 ， 2, … ， r ， 向量 _r=a … u„ , + … + 适合 .j ■丄 

.V■，且 J I 知■「十… ~f : a„ ! z = 1. 于是 

A„ (/ \-B) (A - B) 一 J； U t ； 'A,(/\)>A„ 「⑷， 

5. 试应用定理 U. 3. S)”一/ ■次来证明定理 （4. 3. 15). 

S. 试说明，如果 A 和 R 不是 Hermire 矩阵，则 W ey l 的简申不等式组不一定成立.提示： 
考虑 /i=[° 1 iiflB=r° °i. 

Lo 0」 Li 0」 

1 - 如果 A，iifcM,, 是 Hermhe 矩阵，它们的特征值按递增顺序排列，又如果]<々<», 
证明 KA I ^( B )： H j = k + »). 

S. 试对定理 U.3. 10) 的证明屮有相同项 A, 的情形给出洋细说明.提示：如果义，是以0 = 
0的6重根， k >2, 址明，在得到的 （4. 3. 〗4)中， （4. X 14) 的分母中的〆 (/) 的因式 — 

可消去 （4. 3. 14) 的分子中 /(U 的因式 （/- Ad* 

9-设是双随机矩阵 ( S . 7)， 16R " 是实向量.证明优化 x. 提示：设）,= 
S =- 只要对与的情肜证明就可以 _f ， 因为如果不是这样，就可以对适 

当的置换矩阵 P 和 Q 来考虑尸.>，和 Q』_ ; 仍是双随机 矩阵. 设《^ — i； 〜， 于适， 

/= ! 

0 < < 1 ， 且文 X = L 证明 

J I 

- i-(k — ) 

l= 1 J l 2=1 广 I 

^ - - ri ). 

J -- ] , t ] 
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10. 用 F 述思路给出定理 (4. 3.26) 的 M —个 证明： 若力=[\」6如„是}1«1^ 6 矩阵，则 
A = UAC /' ,其中1/=[«,,]6衂„足两矩阵 ， A = diag ( A J . A „) 是实对角矩阵.设 a = [ a „， 
a r .'< "•* a ™] T 是由 A 的主对角元组成的向量，月 .，=[ Ai ， h ，…， A „] r . 证明 a — P ; r ， 其中 
P = Lp , J-L I i ']• 证明尸是双随机矩阵，然后利用习题 

11- 设丄 = h , …，和 .尸 - h , …， ％： T 是两个给定的非负实向量， M . 假定 y 优化 . r . 

证明 y …提示：利用 U . 1 32) 构造一个实对称矩阵二 [ a „ ]t M „ ( R > ，其中主对角 
元口戸义，而特征值 A , W )=. r 」. 则 Hsdamard 不等式 (7. 8, 1) 是指 >det A = A ] … A „. 

附注这就是促使我们选择优化定义 （4. 2 4 )的理由，如果有人选择与 （4. 3. 24) 中的 

不等式相反的方向，则所得结论与习题1丨中的不等式相反，即，如果在这个意义下 _ 

. y •■优化”则 ）’， 的乘积小于，的乘积.我们喜欢的定义形式是，乘积不等式的走向 
与优化的方向相同. 

12. 设 . AGM ,」 是具有正特征值 0< Ai < A ，<〜< A „ 的 flermite 矩阵，乂设 l < r < n 是一个 
给定的整数.用习题11证明 

A ] A ："' A , = min ( H| . Au x )(. u ' A « .)•-(«； Au ,) , 

其中极小取遍所冇标准正交组卜, ，❿ ，…， «,} CC \ 说明为什么这个结果可以相继看作 
(4. 3. 19) 的乘法模拟， HHdamard 不等式 （7. 8. 1) 的推广，联系 Rayleigh - Ritz 定理 （4. 2. 2) 与 
Hmrlanwd 不等式的不等式系列.提示：情形 r = »是 （7 . S , 1 ), 情形/— I 是什么？若 
”， 用 (4. 3. ]9)证明，向 uJAu ,, ―, 优化向 M [川 ，…， p ] r , 其巾， 

对所有；=1，2，…， r -1 , a — A, ， Iflj 

/ 々「 （ W --A", + …’ «*_! Au, 丨 ）一 （Ai - … A, i) -l «,* Au, u' An,. 

然后用习题 ii '止明八… a , , h ；. a «, s ；： . 

13. 设.4 = [£^ ]& M „ 是具有非负特征值 0 d … 《 A ™ 的 Hermite 矩阵. iiE 明，对每 

个 r = l ， 2，…，〜乘积 V _ A r 小于或等于 A 的 r 个最小主对角元之乘积. 

14. 如果 A ， BeM , 是 Hermhe 矩阵， A - B 具有唯一非负特征值，证明对所有/ = 1, 

2 , 〃冇乂」（4)>乂（出. 

15. 试用（4‘ 3. 18) 证明 （L 3. 25). 提示：用置换钔咗调整 A =[ 〜] 使如 <七 2 
然后取 U = Lf -!^ …，并 II 证明 Ai (/\) + … — A , ( A ) 在 tr [/‘ ^117=4, H … — fj „ . 

16. 假定 AtM ,, 是 Heraiite 矩阵，设 ; U < — 是 A 的特征值，而…孓九,„,是 

(n ])XU — 1) 主 f 矩阵 的特扯 值，证明 


Ai A,.i A ,,：； A llT - i si；. A„. 

这些交错不等式常 C 功于 Cauchy . 同时证明这些不等式蕴涵 （4. 3. IS ) 中的诸不等式.提示： 

利用 （1.3. 8) 或 （4. 3. 15). 

17. 如果 A — 是 Hermite 矩阵， Q 对某个，， a „— 夂. 证明，对所有 A = ], 2， 

…， n , k¥->, M a^-a^O-, 如果则也冇类似的结论.提示：对》>2采用直接计 
算，然 G 应用交错性便可证明结论. _ 
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18. 设 是 Hermite 矩阵且设 a , = (ktA(U， 2,…， i ' s ), ； = 1, 2 , n . 若 A 是 

非奇异的，证明 A 的非负特征值的个数等于序列 t 1， …，《,，中正负号的变化次数. 
恃别地，若这些主子式都是正的，则 A 就不会有负特征值.如果某个 a ,=0, 会出现什么情 
形？ 提示： 利用交错性. 

]9.设; A = [\]eM„ 是正规矩阵.证明，若 A 有“小”列或行' 则 A —定有“小”特征值. 
说得更明确些，设 A 的诸特征值的绝对值的平方 { I A, IS 〖 = 】，••■，幻按非减順序排列， it. 
且用表示所得到的有序值.设各行(或各列)元桌的绝对值的平方和的平方根 

{(S = i 按非减顺序排 列， 并且用足表示所得到的有序值.证明 

i = i 

^ 2记，其中々=1，…，打， 

! - 1 t — 1 

一个类似的上界可用列平方和表示. 提示： 数 MW 是 Hermite 矩阵乂 A+ 的特征值. AA* 的诸 
主对角元是什么？用优化和定理 (4.3. 部）.关干列和 f 等式可考虑 A’A. 

进_步阅读 关于优化的另外信息可参看 [M01]. 在定理 （4. 3. 10) 下面提到了诸主子矩阵 
的特征值间的一般交错不等式组，有关的讨论可参看 C；. K. Johnson and H. A. Robinson, 
“Eigenvalue Inequalities for Principal Submatricea/'Lui. Alg . Appi . 37( 1981 ), 11-^2. 习题 4 
中概述的论断的原始证明可参看 H. Weyl, “Das asymptotist-he Verteilungsgeselz der 
Eigenwerte linearer partieller Differentialgieichungen (mit einer Anwendung auf die Theorie der 
Hohlraumstrahlung,"/Wa^. knnaim 71 (1912) . 44Iff.； 在文献的 411-445( 页）可看到其引理 
的证明. Wey] 用积分方程叙述并证明了他的结果，但把它转化成线性代数的形式是直接的. 

4.4 复对称矩阵 


_ 


矩阵 A 6 JW , 是对称的，是指在许多场合，所研究的对称矩阵只有实元素，因而 
它们是实 Hermite 矩阵，并且本章迄今所讨论的全部结果都适用于这些矩阵. 

但是，在有些情形，我们要与复对称矩阵打交道.一个例子是研究复平面中单位圆盘的正 
则解析映射，如果 / U ) 是单位圆盘上 的疋则 解析函数，又如果 /( W 是适合/(0)=0和/(0) 
二】的标准化了的函数，那么， /( d 是 一一 的（有时称为单叶的），当且仅当 








对满足 U , 丨<1的点 q ,…， z ,, fc 的所有选#,点 a ，…， 』. n ec 的所有选择和所有 " 二 
1， 2,… 成立.如果 ： ,二&,，则右边的荖商可以看作 / GJ . 这些称 SG rulls ky 不等式 组的庞 
杂不等式有很简单的代数形式 


.r* Ar >| j T B.r \ . (4.4.2) 

其中 


S 二 log 


l«g[ 


^___ /U) — fiz,)- 




应注意的是， A 是 nern ^ e 矩阵 . jfli B 是复对称矩阵. 



Hermite 矩阵和对称矩阵 


145 


另一个自然要产屮复对称矩阵的例子出现在一般的矩问题中.设{«,,，…}是给定 
的复数序列，设是某个正整数， a 定义 A :,„ = [七] = 注意 Ah 是形状为 

Hankel 矩阵的复对称 矩阵. 对 . r 6 C 2 ", 我们考虑复二次型 / Ay , 要问是否存在某个固定常 
数('>0, 使得对所有 . rec _〜 和所冇7? = 1. 2，…有 

I | r.r 'x. 

根据 Ncbari 定理，这个条件成立，气且仅当存在一个儿乎处处有界的 LehPsgue 可测函数 
Fit )： F ( t ) : R - C , 它的 Fourier 系数是已知数％， t 〜，•■‘；关于 F (0 的本质边界恰好 
是卜_述不等式组的常数 c 


在实际应用中复对称矩阵似乎不像复 Hermhe (或实对称）矩阵那样儿乎经常出现，但是前 
两个例子说明，它 fll 还是出现广虽然复对称矩阵不一定可对角化（见本节末习题 15 j , 可是 
复刘称矩阵冇一个类似于 Hermite 矩阵的谱定理 （4. 1. 5) 的分解，可以用逻辑上类似的方 
法来证明它.我们首先证明…个与 Schur 三角分解定理 （2.3. 1) 类似的定理，它说明.包括对 
称矩阵在内的一类矩阵总可以分解成 A = L ^ U / T , 其中是酉矩阵， d 是上: r : 角矩阵，如果上 
二角矩阵是对称的，则它必定是对角矩阵. 

4,4.3 定理设 A6A1 是给定的，那么存在两矩阵 C7&M, 和上二_角矩阵 zieM„ 使得 A = 
腳、 当且仅当 /Li 的所有特征值是卄负实数，在这个条件下， d 的所有主对角元可以选取 
非负值. 

证明： 凶为 [/ 是 西矩阵 a 所以，如果 A = [ M (7 r , m aa = uau ^ uau \ 

是上 1 ^ 角矩阵时， I : 一角 矩阵 Azl 的诸主对角元是非负实数，且酉相似于因此，从上 
:角矩阵的诸特征值恰好是它的诸主对角元这一事实便可推出条件的必要件成立. 

关于充分性，假定 AA 只有非负特征值，且设 j ' 是 A 4 的一个特征 向最； 即 /17 b ' 二 Aa 
且 A >0, 有两种口 |能 情形： 

( a ) A _ j •与/ 相 X ; 

( b ) AS 与/无关. 

在前…种情形 （al (当 A 是九耳的单特征值时，这种情形总是成立的），存在某个 yGC, 使得 
怛是 | 户 | 因而 | " | 在后一种情形 （b) 

(如果;I是 AA 的1特征值，这种情形可能成立），对所有 p6C , 向量 + 是非零的， 
并且可以选择 (U 为适合 | 戶 | 」 = /(/1=又的任一复数.于是八 v 二 Ad-| ftr ) — AA-f \ / jAj = Xj : 

在情形 （ a ) 或 （ b )， 我们已证明，存在某个非零向 
和某个有 I =彳的斤1：，使得 Anw 因为这个树等式在 t / 乘以止纯 f | 后不变^所 
以还可以假定 I 是单位向景.同时，对仟意沒 GK . 有 〆 = f %v = u a 当 

i ■是单位向 M 时，也是单位向 tf , 因为可以选取使得凶而得出，如果 AeM „. 
且 A 是 AA 的非负特征值，则存在单位甸量. E ,, 使得 At ,— 仰，且十办 0 . 

现在把这个向量”扩充为 C " 的标准正交基彳^, _‘■，「1.设％是以这些向量为列 

的矩阵‘因为标准正交性和等式山,一仰，矩阵的第一列有元素 a 
此，除 rvrAw 的第-列中第.个元蒺以外，所有兄素必须为零（第一个元素也可能是 零）. 
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(4. 4. 3 a ) 


因此， AS 的诸特征值(根据假定它们都是非负的）是¥以及 A , A 的诸特征值.由此得出，通 
过这个简化过稈所得到的矩阵 A 2 f ,也有使 A , A , 的所有特征值都非负的性质. 

现在可以对于 A 7 及其后继矩阵重复实施上述简化过稈，至多经 H - 1次（正像在 Sctnir - 
角化定理 (H 1) 的证明中所做的那样）便得到 

~o^ * _ 

VXivMViW-K ,二 — A ， 

0 0 „ _ 

其中， Zi 是 a 冇非负主对角元 a , 的上角矩阵.如架令 (7 = ^.. … w ,, 则有 A — [乜 ( T , 这 
m 是所欲 求的. 门 

练习.直接对矩阵 A = t—j ^实施定理 （4. 4.3) 证明中的计算，并明4二其中 

「0 2n 1 n 

i = L 。 。」’ U= $L 

如果"為2，并非每个矩阵 AGAi , 都有使 A / V 的所有特征位均非负的 性质 ； \ — 
厂0 11 

_ i 」就赶一个简妒的例了因而.定理 （1.4. 3) 4 Schur 三角化定理 （2. H ) 只 M 部分类 

似-每个 AeM „ 可经形如 A — CMLT 的变换（其中汽矩阵 L T fM )-_: 角化，不过.只有使/\万有 
全部非负特征值的那些矩阵 AeM n 可经形如 A — UAP 的变换(其中酉矩阵 U 6 H ,) 二角化. 

每个对称矩阵 A & M ,, 有如下性质 ： AA = A . V 的所有特征值都是非负的.该特殊形式已 
包含 在定理 （1. 1. 3) 中，人们通常把它归功千 Schur (1 M 5). 但是较早的证明是由 Hu S 
(1944), Siegel ( 1 吋 3 >和 Jacobsen ㈠ 们 ㈦ 提出的；而历史的优先 权显然 应该属于 Takagi 
0925). 

f 20"4； 4.4.4 推论 （ Takagi 分解）如果 Ae M „ 是对称矩阵 (A = A 「>， 则存在两矩阵 (7 GM „ 和非负实 

对角矩阵便得 A = L 2 l ； 7 . fJ 的诸列是由 AA 的特征向量组成的标准正交 
组，而2的相应对角元是的相应特征值的非负平方裉. 

证明： 如果 A = , V . 则冗= 4'，且 AA = AA ，. 如果 . r 尹0是 nemihe 矩阵 A / T 的任一特 
征向量，且 AA ’： r = A 丄，则 - dT 二; KAO — j -* AA 1 丄 = ( A *.： r )* ( A " 丄).因为 〆 ： y >0 对所有 
成4：, 而 ， _v = 0 当 I - L 仅当： >> = 0，所以有 A = ( A *. r )， 因此，只要 A 是 
对称矩阵， AS 的所有特征值都为负.定理 （4. 4. :^)保证存在西矩阵 L / eM „ 和卜 .二: 角矩阵 
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_ 如果用分块形式把这个矩阵写成 
巧 AV , ^ 

我们看到 


e c " 1 ， a 2 e m„ t , a>o. 


(VjAV^iVj'AV,) = vr A 4 V, - 


a 1 aw T \ w T A , 
0 A. C A, 




Hermhp 矩阵和对称矩阵 




所有 ff , > 0. 


L 0 


使得 A = UdU ' m 是〖圮[只=兌= 4 7 = (^1〃，因而 4 = 这只有在 Zi =2 是对角矩阵时才 
能成立.根据构造， d 是非负的. M 后， AA ^ USU r mU - =[.2； Z U '是 Hcrmite 矩阵 AA 的酉 
对角化，闶而， U 的诸列是 AS 的特征向量. □ 

形如 [/A [厂的任一矩阵，其中 A 是对角矩阵（不 一定菲 负），显然是对称的，因此，为 f 
使某个矩阵能分解成 A=[7A[/ T = [Mi7_ — UA0 、其中， U 是西矩阵，而/I是对角矩 
阵，X必要充分条件足 A 是对称 矩阵.在定理（4.6.11)中给出了/\可以分解成4 = 5^15 1 的 
条件，其中 A 是对角矩阵，而 S 是作奇异矩阵(但不一定是两矩阵). 

每个复矩阵 At M,, 可以写成形式 .4= 其中，V ，是酉矩阵， | fij2 是貝有 

非负主对角元的对角矩阵.这就是奇异值分解.将在 （7.U 节屮讨论它. 2的诸对角元是 A 的 
奇异值.关于（可能是复）对称矩阵的 Takagi 分解 A =^ USU r 是艾于对称矩阵的特殊奇异值分 
解， 其中\/一审. 

在定理 (1.4. :»的证明中所采用的构造性方法可以用来计算复对称矩阵的 Takagi 分解.因 
为 A 的对称性，所产生的矩阵 Zi 将自然是对角矩阵.见本节末习题 9. 


练习直接对矩阵2实施定理 U . 4. 证明中的计算，并证明其屮， 

1 p + V 2 / I 

Vi I 2 . J 2 V 


,- K 2 

Lo 


U 


/2」 V 4 I 2 V 2 I . ^ 1+ W 」 

注意， 4 自然是对角矩阵. _ 

由丁- lakagi 分解 A-Lf^t； 1 中两因 f U 的 诸列是 Hermits 矩阵 ATf 的特征向童，这可能 
会误认为，如果 A4 土 L/fU' 是酉对角化的，则八= 021^.实际情况不一定如此.考察例子 


.4: 


| 便可看出这一点. W 为 AA — f , 所以对任何 2 X 2 实正交矩阵 Q , 有 /VA QI " Q T , 


Ifii QIQ l = l ^ A , 问题是 AA 有里数大于1的特征值，因而 AS 的仟一特征向量都不可能有 AS 
的 性质； 这个特征向量不可能给出 A 的所欲求的化简.如果考虑基向量 e ,, 则 = 
而于是有定理 （4. 4. 3) 证明中的情形 （ b ). 根据证明，可以取 ™ = 
Ac , \ If , - = p ; +(；!, 这便得到向量 ^ (a+0 > 它能化简 A . 因为 ％ 2(a —£.?)/•/? 与 

正交，可以取 


井乩得到 V^AV — 


M , 

v^Li -1」 

「丄 oi ri oiri oi 2 

L — J—L 1() ; 」二肌 因此， 如果令 
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则 SA 的一个适当分解.应指出的是，实对称矩阵的 TAagi 分解 （ i .4. 4) 不可能存 
实因子. 

刚才所讨论的例+中的困难以及在•般情形中的困难是由 AA 的重特征值引起的.如果 

的所冇恃征值是不同的，又如果采用 （1.4. 3) 证明中的构造法来计算复对称矩阵 A 的 
Tskasi 分解.那么.总冇情形 U ) (见习题 9). 在这种情形， AA 的毎个特征向 fi / 有 性质； 
对满足 和 AAj ' = c ^ 的某个 a ec ， ^ A 7 = a . r . 因而，如果 = VS : ‘V * 是 

Hermite 矩阵 AA 的酉对角化，则必有 V 2 D ' 其中 D 2 二 cliagQK ,…，;只要知 
道了 V 和 2($ 的非负平方根），这个恒等式就可用来计算相应于2的 伟零对 角元的 D :: 的对角 
元.相应于2的零对角元的的对角元是仟意的.且可以取为 + 1. 最后，如果令 U ^ VD 和 
D ^ diagC〆 1 ，…， 〆 "），则有 A = ( VD )2( VX 0 r -= ri _ S [/ T . 我们把这些论断 

总结成下述推论. 

4.4.5 推论 如果 AeM„ 是对称矩阵，且 AX 的特征值瓦不相同，又如果 AA 二 VTV •是 AA 
的两对角化，其中 S ^ diagU , …， a ,,) 且所有则存在对角矩阵 D = di at ; ( f' e i , 

(其中所有 見 6 R ) 使得(其中 U = VD ). 相应于2的非零对角元的因子 D 的对角元由 
义系式 AV = V 2 D : 确定； 相应于2的零对角元的 D 的对角元可以取为 + 1. 

如果 A € rM „ 是对称矩阵，并且利用 （4. 4. 4) 把 A 写成 A 也可以把它巧成 .4 = 

( L 2 l 2 )([/2 d ) T ， 其中 2 l; = dmg ( + vV ， —&，•‘.，+^7).这番论证构成下述推论的 
证明. 

4, 6 推论设 AC M„ ，则 A 是对称矩阵，当且仅当存仵矩阵 S t 使得 A =^SS r . 可以选 
取 S 二 17D , 其中 LT 是 H 矩阵， D^diag(v^'. y^" ： 而<^，是 A 的奇异值，在这种 

情形， rank S = rank A. 

虽然实对称矩阵是正规的，但非实复对称矩阵不一定是正规的.如果.4 = 3 +汇6^，其 
中 B 和(■:是实矩阵，则 A 是对称矩阵.当且仅当 S 和 C 都是实对称矩阵.如果 A 既是对称矩 
阵，乂是正规矩阵，则 

A/T = ( 汗 + C 2 ) 4- UCH ~ HC ) = ( B 2 卞 C : j + i(BC -CB ) = A'A 
由此可以推出方与 C 可交换.在这种情形下， d 和 C 可经实正交矩阵 Q 同时对角化.如果 B 
- QO t Q 7 , 11 C = QD 2 Q [ , 其中 和认是实对角矩阵，则 AtB + zOQDiCT + rQAQTs 
0(0； + iD 2 ) Q T = QAQ T , 其中 ylsDjf ' A . 反之，如果矩阵 A € M „ 可写成 A sQAQ 1 ，其巾 
Q 是实正交矩阵，而 A 是对角矩阵，则 A = A F ，且 AA " = QAQ r QAQ T = Q | A z Q r = 
QAQ T QAQ T = A - A , 因而 A 既是对称矩阵，乂是正规矩阵.这就证明了下面的定理. 

4.4.7 定理 设 AeM„, 那么， A 既是对称矩阵，乂是正规矩阵，气且仅当存在实庄交矩阵 
Q € M „( R ) 和对角矩阵 yieM „ 使得 A = QAQ t . 

一个既对称乂正规的复矩阵的简单的有用例子是 
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s 1 u+m ’ 


4:中 s 是“后向单位”矩阵 


它曾在 ( 3 . 2 . 3 ) 中证明每个矩阵相似于它的转置时起过作用. 

因为 = h 所以 

SS - -i-(7 + fB )(7 - ? 'B) - ^ - ,'ii + iB + ii 2 : 

由此可知， S 既是对称矩阵乂是酉矩阵. 

现在考虑具冇零主对角线的标准 Jordan 块 k ^ 2 , 把它写 


经简单计算可知 


因此， N 酉相似于矩阵 


士 CN 十 BNB) + 4r(BN — MB: 


0 


0 . 


(4.4.8 a ) 
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它显然是对称矩阵.仟一 J OT d arl 块人 （ AK 02) 具有形式 AI ! N , 乂 SNS 1 是对称 矩阵， 所以 
S 7 ( ( A)S l ^ S!M + N ) S -'= kI+SNS 1 是对称矩阵. 

每个矩阵 A 6 A 九都相似于它的 Jorcbm 标 准形八 3. h 14), 其中£ = 2,且 2) ① 
… ® J 、 U ” 2) 适修改后的诸 Jordan 块人 ( A ,，2) 的 . g 和.这个论断（它相当于在上述论证中用 
2 N 代替/ V )允许我们略去 （1. 4. Sa ) 屮的系数因.当02时，如果我们设 S „=(1/^2)( I ^ 
是形如 a 4. 8> 的 n , Xn , 矩阵，且如果令: r = s „ ; ㊉ …(则卜.述论证说明， 
TJT 1 = TJT - (. V 、认.2% ) @ …① （ S „ 人 a ，2) l ) 

是对称矩阵的宜和. w 而是对称矩阵. W 为毎个 . s „ 是西矩阵，所以矩阵 T 是酉矩阵， W 此 Q 
经证明，呈 ■ Iordan 标准形的每个斯阵等价十 -- 个对称矩阵.因为每个矩阵相似 Jordan 矩阵， 
故已经证明 f K 述定理. 


4. 4.9 定理 '每个矩阵 y \ GM „ 相似十別称矩阵. 

实阮上，已经证明每个矩阵 Afe M „ 相似于对称 Jordan 标准形 S B[ ^ ❿ S % U h 其 

■ I 1 . 如果 A — a 1-屮， 1 U , K 则 

S t (A)- Sj t (^.Z)S - A/ + .S.\ r ,S 


- Al 

且、 S 由 <4. 4. 8) 给出.注意 





Q ) — [ A ] 


lil|" So (A) 



A + i . 


因为这种形式是 fi ； 接从 Jordan 标准形推导出来的，所以它的唯一性与 Jordan 标准形的唯一性 
相同. 


这个结论的.个推论是，艾于复对称矩阵的谱、 Jordan 块、极小多项式、特征多项式或不 
变因4都没冇讧何特别的结果.如果这些量中任何可以出现在某个阶数的对称矩阵中，则 
它也"了以出现在同 阶的一 般复矩阵中.屮的每个相似类包含-个对称矩阵， C " 上的毎个线 
性变换有一个对称的基表示，矩阵的对称性只不过是为表小•相应线件变换而选定..-个特殊的基 
的人为现象.另一个推论是.每个矩阵相某种息义下“可对角 化”. 


4.4.10 推论 设 A 6 M „ 已知.则存在非竒异矩阵 S 和酉矩阵17，使得 （ L «) A ( DS ) 1 是具有 
非负对角元的对角矩阵. 

证明： 利用 (4. 4. 9) 求非奇异矩阵 S & M ， 使 SAS 」 是对称矩阵’然后利用 （4. 4. 4) 求丙矩 
阵 t / eM „ 使 msAs -^ ir 1 ' 是非负对角 矩阵. □ 

定理 ai . 9 )同时 推出； 每个复矩阵相似于它的转置，且毎个复矩阵可以写成两个复对称 
矩阵的乘积.这两个结论对任意域 t 的矩阵都成立，但定理 （4. 4. 9) 对一般域不成立. 







Hermite 矩阵和对称矩阵 151 


4- 4.11 推论设 AtM , 已知.则存在矩阵& CeM „, 使得 —/ i 1 ， C - C T , H A - fiC . B 
或 C 可以选为非奇弄矩阵. 

证明： 利用+定理把 A 写成 A = S£S 其屮 £：=£； r ， MS 是非奇异矩阵. 十是 A = 
( SES y )( S T ) 'S : ^( SES t )( SS 7 ) ^ BC , 其巾 和0 = ^都是对称矩阵.乂因为 

A = ( SS')(S l ) T ES \ 所以因子 B 或 C 可以选为非奇异矩阵. □ 

Gram - Sclimidt 过程 （0. 6. 4) 在研究正规矩阵中有许多应用.有一 f 类似的过稈对研究复对 
称矩阵逛有用的. 

4.4. 12引理没心，…，心6(^是给定的向量， H . k<n. 则#在向 M . V ! * …，： Vn 使得 
S P ； m {. r ,， …. ^^ Spaniv ,, - , . V / f - 并且对所有！ ■， j~] t 2, -. A 及，关； 冇火兄 = 0 , [ 2 JQJ 
对，二1，2，■有/: v 」， l ， 对卜; r +1, .... 6冇义 Vi = 0 , 其中 r = rank x t' x 且 x = h … 
^^臣加^是其列为巳知向量^的矩阵. 

证明： 因为矩阵是对称矩阵， Takagi 分解定理 U . 彳. 4 )使我们可以把它成 X r X 二 
，其中 ， LJG 是两矩阵且2 — diagft ^ , ... ， ij t ) ，而① … i 二0 = ■-. = 

的 ， rank X T X ^ r , 如果令 D 二 ding ( ~/7，… . V GT ， 1 , , 1 ) 6 M ( ,且记 f , = diag ( l ，…， 

i , 0. …， 0 )^ M k , 它有 r 个 1 flu /- 个 0, 则 X r X —( L / D )/,(!7 D) r r S_u 其巾 S 二 m/ v 
是非奇异矩阵.因而 （XS 因此，如果令 XS 」= y =[_ Vl ， •... yjGAt .*, 因为 

y r y ~ i - 则列向 tt . yi ，…， . y „ 具有所要证 明的性 质. n 

上述引理叙述的法则形式上类似于 Gram - Schmidt 过程， Gram - Schmidt 过程是针对 X ■'入 
Ifli 不是在 Schmidt 过程中，对每个 j 1，2，…， A ,每个％可以作成 . r , ，…， 

A 的线件组合，似在这里可能行不通.另一个差别是，在 Gram - Schmidt 过程中，具有 
I 的向量； V, 的个数等 T rank X ■(诸无戈向量 _t_ ，的最大个数），它等亍 ran k P X . 但是在这种 
情形，具冇 y ； v ,- i 的 向量乂 的个数等于的秩，它可能小于 ran k X . 

例假定走=1，且 二; 则 XlsO , 丙而 0 = ran kX , 它严格小于 nmk X — 1， 

只可 能是刈 的纯董倍， W 此不可能选取. Vl 使得 Span { x , }- Span ^ v ,} ■而义 ^-1. 

例假定4 = 2,且叉二 1 ：.〜;^」二^ | j . 则 rankX T .Y = 2， 并 iJ . 存在 向量％， y z 使得 

S pan {. V i，v ; }^Span!. tl - A ；■及 iv , iil>; ^'.r , - 0, 所以不町能选取力为的 

纯 M 倍. 

我们所考虑的直接应用是针对可对角化复对称矩阵的特殊情形的.如果4 = ，且 

1 =sas 1 ‘其中，对角矩非奇异矩阵 seM ,,， 则显然不能从这个通常的对角化表 
示推出 A 是对称矩阵.但是，如果 S 是复正交矩阵，则 S -1= S T ， 且 A=&1S - 1=SASJ ■显然 
是对称矩阵.下面的定理说明，总可以选取 S 为复正交矩阵. " 

4.4.13 定理设是对称矩阵，则 A 可对角化，当且仅当它可复正交对角化，也就是 
说. A 二 SiS - 1 对十对角炻阵 A & M = 和非奇异矩阵成立当且仅当其中 Qe _ 
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M , 适合 Q T Q —/. 

证明： 假定 A — . V ' 乂设 ) fC __ 是,4的特扯向丨 1. A 』_ = Ax . Ay^fxy. 如果 A 关屮 
则 y 「4 j . —. vH . vV , H . v r A .)'^ (fiy)' x= ny' ,r , 因 (fif A jV ，又因为 A # 

所以 >6=0. 这只 + 过足把^疋交件原 7) 应用十对称矩阵.如杲/\是可对角化的， 
a ，4-. S'^S ', 不尖一般性.假定在4=山®… ㊉ A ,, 屮./\的相 N 特征值排放在一起，其中 
/ I , =" A,i C M „ , 7!』~ h ;,. : n . 当洋 J 时 A 」#'. 把 S 的诸列块分成 S = [a •••.<；„ | = [ S | S : … 

S ] 使之与 A 二 A ,® … GM ,, 分法相 Ini , 丁-是，对 f -- l . 2.…，心 S , 6 iW „. rti . 由双正交性质， 
如果 ; r 7 . 则_ W 为 YS 趙非奇异分块对角矩阵，所以，对所有 ； =1, 2, 
d, S 3, 非苛异.由丁 •每 个矩阵 . S /. S , 是满秩的.引理 (4. 1. i 2) 说明，每个 S 」 的诸列可以 
用新列米代转，它们是诸旧列的非奇异线性组合， J 1 彼此复 正交； 即存在非奇异 矩阵兄 
使 Q , = S 兄适合 . W 为对所有；乒 j , 0；0,=^8!3^,=0 ,又对 

, = ]，2,…，丨 AQ, ■■ AS,R, 所以矩阵 Q = LQ , …仏]^ iK 是复正交的，且 
A -= QAQ \ □ 

上述结论町对定埋 （L 4 . 7 ) 作出很 好的解泽 ； 对称矩阵 A 可对角化，当且仅当 A = QAQ S 
iiQ 是复正交矩 阵：乂 /\是正规矩阵.当且仅$ £ J 可以选为实 正交 矩阵. 

可以对定理 U . I . 1幻中的结果稍作推广.若 A . 是对称矩阵，则 A 与 B 相似当且 

仅当它们可以通过复正交相似来实现相似.事实上，假定存在一个多项式使得 A r = p (4) 
且在这个较弱的假定 K_L 述推广成立.见 [ HJ ]. 

习题 


1 ‘假定 A6M,, 足对称矩阵， H.A = h + /C：， 其中 B ， 都是实矩阵.证明， A 是正 
规矩阵，当叵仅当 fi 与〔' 的交换，证明，，4是止规矩阵.当11仅当 A3 是实 矩阵. 证明，/\ 
是正规矩阵，4且仅当 d 与 A 可交換.给■出一个对称矩阵不是正规矩阵的例子. 

2. 下面给出推论 U . 4 . _1;的另一个证明的要点，请作详细的论述.记号和假设如 （4,4.4) 
中所述.若是奇异的.设 U 】， …， 《 s ; ■是 A 的零空间的一组标准正交基且 U 二 [叫……〜叫 
…16 丙矩阵.则 

心 [_ ； = 匕 】,]. ah 

其中-<是非奇异对称矩陴‘ Ii : ] 此‘不尖一般什，我们可以假定 A 是非奇择的 . @a = B + C , 
其中 月 . r 是实矩阵 ， ina z = x + i y ^ c \ 其中 , v er . 乂设 ^ = 

Ues' U ) B , 「和 f 是实对称矩阵-讨沦 HS + C )(, r + 0 ,) 与 K 之间的关系 .a) 


F 是非奇异的.提示： t - Fi=0, Ar 是什么‘ 


aoSF U 


则 f H = - 七]‘ 


可以把 F 的非零特矸值按一正一负配对. （d) 设 F 相应于其正特征值 A,， …， A, 的标准正交特 
征向 记作 . v _je R ' j = 1 ' 2f 设』 Y 三 d y=ly ： , 又设 2： 
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- diagfAi ， l r ) eM />r 关于实对称矩阵的谱定理是指其中 

H。] “U ， 

a V 是实正交矩阵.（为什么？)设 [_ f = sx — ; y . 证明 [/ 是西矩阵 

a - 当 A 是实对称矩阵时， （ LKH 兑的是什么？它与实对称矩阵的通常谱分解有何关系？ 
提示：如果 A = GAQ t , 其中. 豸是实对称矩阵，而 Q 是实正交矩阵，把成力=!：//且设 
U = QD . 什么时 MTakagi 分解[厂中的所有因子可取实矩阵？ 

4- 如果 A = U £ U 「 eM „， 且 U 和2如 ( 4 . 4.4) 中所述，试通过直接 i ! 箅 证明， Y 是 AA 和 M 
的特征值，且 XA 和 AA 是 Hermite 矩阵.证明 （J 的列《」和数的适合方程如,=邮,，！ = 1, 2, 
-- N - 或许因为这个理由，冇时称 a , 为广义特征值.不过，术语奇异值似乎更为通用. 

5 - 假定 AeM , 是对称矩阵，设2和 U 如 (4. 4. 4) 中所述，5把 A 的诸奇异值^，排成递减 
顺序… >久>0. ( a ) 试修改 Rayldgh - Ritz 定理 （4. 2. 2 ) 的证明来证明 (； raK = aj = 
max { I .H I Ar \ r : 0^6 C 1 }, 即类似于 （ 4. 2. 2 ) 中的 h 界，复对称矩阵有相应的论述. 
试考虑 U 的第丨列来证明，该极值由适合的单位向量来达到. （ b ) 试考虑 A = 

和来说明，在这种情形. H „ 弇 mi tl { | ! △' O ^ j - eC }. 因而，类似于 

(4.2. 2) 中的下界，对复对称矩阵的相应论述不成立. （ c ) 试考虑 A =/ eM 2 , 来说明 

max ; l ? A_r I /, rx -. Q ^ xeC ' 1 , jt 丄 wl =0. 由此得出，类似于 （' ouTant-Fisclier 极小-极大公 
式 U .2. 12)，对复对称矩阵及其夺异值的相应 论述当 i > l 时不成立.但是，可以看一看 
(7.3.10). ( d ) 类似于极大极小公式 U . 2. 13)，关于对称矩阵的相应论述足什么？ （ e ) 设 

[| 及)，而 A =[1] U =1) 是删去 2的最后一行和最后一列后形成的矩阵‘注 

意，类似于 (•■!■；?. £0,交错不等式是不成立的. 〈 f ) 不过，还是有关于加边对称矩阵 
的诸奇异值的不等式.设对称矩阵且冇奇异值1会…而(有奇异值 
是删去2 的一 行和相应的列形成的矩阵‘试用定埋 （7. 3. 9) 证明 ，… k 
= !，•••， n ( a „ l 2 =0). 对于 ( e ) 中的例子验证这些不等式，然后把它们与关于加边 Hermite 矩 
阵的诸特征值的诸交错不等式 (4. 3. 9) 进行比较. 

6. 如果 A6M„ 是对称矩阵，乂如果 A = L/2t；S 其中， [_/ 是两矩阵， 2 = diag( ffl! , 
…，〜），且所有*>0,证明 A 的秩等于非零项&的个数. 提示： 如果 ceAi 是非奇异 
矩阵 ， 则 rank A = rank BAC . 

7. SA = B + / CeiW „, 其中 B , C 是实矩阵，乂设 一 (a) 证明， = 

B 2 + c -+ i { Bc - cB >, a 

_ | r B 2 + a Bt ； - CE 1 

一 L -( bc - cb ) + c J ' 

( l >) 证明 — j ^是酉矩阵 .（ c ) 证明 SF 2 S '^°_ j . 
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( d ) 证明 F 的进特征值的平方就是的珩特征值及其复共轭. （ e ) 如果 A 是复对称矩阵， 
证明， F 是具有实特征值的实对称矩阵，戸只有非负特征值，且 F 的特征值平方的集合与 
Hermitc 矩阵 SA 的特征值集合相同. 

S . 设 AeAl 是复对称矩阵.考虑二次型 J ')= J ' T A . r 和由 A 生成的双线型 
3-) = ^^. 忒用推论 U . 4. 4) 证明 

sup I 沿（ / ，』 . ） 1= sup I b K (jr,y') I = , 

其中^ ( A ) 是 XA 的最大特征值. 

9-试用（ 4 - 4 . 3 )的证明中的 记兮证 明下列命题： （ i ) 如果 J 是 AA — 的单特征值，且/尹0适 
合 AAjt = Ajt ， 则 Aj ： 与 . r 相叉. 提示：设 rj = 卜6成令 w _ 二 Ar — cr > r . 证明二 一 和 AAuj 
=加，因而如是，的纯量 倍数. （ ii ) 如果八=-^,则？ ㊉ Ay 即 （4. 4. 3 a ： (中行向撤 
V 是零.试用它来证明，这个构造法自然产尘矩阵\^._^‘.朽/^ 1 1^"饩- 1 =-[厂*40 = 1而 
ii 是对角矩阵. 

10. . fl 假定有非奇异矩阵 S 6 M ,, 使得/ I 二 &1 S 〗，其屮/!二 dUgGi ，…， _ U . 

证明，4天可对角化，且它只冇非负特征值，^11 rank A-rank AA . 这 Si (1. 1. 4) 有什‘么关 

系? 说明 [:; K - _ 1]都不能写成这种形式. 

1]* 如果是某个斯阵，证明，〜般有 nmk 义 S<rank S ， 也可能有 ninkrank 
S . 如果 S 是实矩阵，会出现什么 情形？ 提示：考察 ° j . 

12. 如果 A 6 JW „ 是复对称矩阵’ 乂 j ', . v 6 C " 是 A 的相应 t A 的不 N 特征值的特征向量， 
证明 : r T y = 0 . 这说明 . r 与, v 正交吗？提示 ： 考虑 

1 3 . 如果 AeJW „ 是对称矩阵，且有 n 个不同的特征值，直接证明存在非奇异矩阵 S 6 M n 
和对角矩阵 D 使得 .4 二 SDS ' 提示： A 可对角化，因而 Ar-SAS 1 t .4 S = SA . 根据习题12, 
S T S = /) 是对角矩阵. W 此 . S _ I A . S = A ' S /1 = Dyl 且 A = ( s _l > T (/ M ) s 、为了证明有复 正交矩 
阵0使/1=0/\0' 需作哪些修改？ 

14. 如果 A 6 JW „ 是非奇异对称矩阵，证明 .4 1 是讨称矩阵. 

15 -实对称矩阵是 HeoniU ; 矩阵，刺而可对角化 . 说明复对称矩阵不一定可对角化.提 
示： 考察 a=G 并计算 a 2 . 

15 . 设 AGJW „， 证明， A 是对称西矩阵，当且仅当 A 可以写成/ \= CilO ' 其中 ， Qe 
JW „( R ) 是实正交矩阵，而 _4 = diag ( A ! ， ... * A „) = diag ( e lrt; . •■*, 〆 • ） ， 并且对 ife = 1 , 2 ，…， rt 
有丨 ； U I =1和凡 GR . 

17 - 试用习题】 6 证明，矩阵 ueAt 是对称的酉矩阵，当且仅当存在西矩阵 veAi , 使得 LJ 
國 = W J . 

18. 我们已经证明每个矩阵 At M „ 相似于一个对称矩阵. 每个矩 阵相似于一个 Hcmihe 
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矩阵吗？相似 T 一个正规炤阵吗？ 

19. 利用 （4. 4. 9) 证明每个矩阵相似十它的转置. 

20. 证明定理 (4. 4.9) 在实数域上不 成立； 即不是每个矩阵 AeM „( R > 都相似于实对称矩阵. 

21. 复对称矩阵 A 可能有迷向向量 r 作为特征 向量； 即， Au = Azn v ^ O , 且但 
是，如果 A 可对角化，证明 A 不可能是单特征值. 提示： 一方面把 A 写成、辻^为5； 
的第一列，另一方面证明，因为 YS 的第一行为零，所以 s T s 是奇异矩阵.特别是，如果 

C - 是使^「1 = 0的任一向 M ， 则(秩 1) 对称矩阵 A = ■: V 不能对角化.参看习题 15. 

22. 对推论 ( H .4) 的另一个证明的下述要点给出详细的论述.记号和假设如 （4. 1.4) 中所 
述.这实质上是 Sicgd (1943) 的证明. U ).47 f 是 Hmnite 矩阵， W 而存在一个酉矩阵 Vg M „ 
和-个实对角矩阵使得 A /\= V 儿 V . ( b ) V ’ A ?= B 既是对称矩阵又是正规矩阵，所 
以，根据 （1.1. 7), 存汴一个对角矩阵 A 6 M „ 和一个实正交矩阵 QeM ,,( R > 使得 B = QAQ t . 
( cJA - CVQJACyQ ) 1 . 现在记 A = E 2 E T , 其中， i ' 均为对角矩阵，是非负矩阵，于 
SlA - UXU 7 , 其中 [/= VQf 是酉矩阵. 

23. 设 jr „ r 是《个复变量的向量，乂设 / U ) 是在某个 K 域 DCC " 中 n 
个 fe 变置的复解析闲数. W 为混合偏导数相等.所以 H =[ J -7/ 戈先]在每 --- 点是对称 
矩阵. （4. 0.3) 中的讨论说明，可以假定一般线件偏微分算子 



中的系数矩阵 A = [ flL J 是对称的.证明，在某一点存在变量的酉变换，使得在 
新坐标系？ ' L/' 在 a 是对角的，即 

= "^，在^ ■ = 4 (7;; …^ 0. 

24. 利用 （4. 彳. 13) 以及类似 T 在 （1.3. 19) 的证明巾所采用 的归纳 证法，证明下述命题.它 
与同时酉对角化一个 Hermitc 矩阵族的定理 1.6) 类似： 设贫二 M„ 是给定的可对角化对称矩 
阵族.则对于所有存4复正夂矩阵 Q 使得 QAQ r 是对角矩阵，当且仅当,> 是交换族. 

25. 利用定理 （1. 1.7) 证明中的证法证明，矩阵既是斜对称的 （A=—A T ) 乂是正规 
的，当且仅3有实正交矩阵 QeM„(R) 使得 QMQ 二0©0®…㊉ (^©A^Az ㊉…㊉九，其中每 
t A,C-M, 有形式 


「 0 z.l 

4 = L , 0 」，^ f C, j = , k . (4.4.14) 

提示：考察 A 的实部和虚部，并利用定理 （2. 5. 15). 什么时候 1 X 1 零直加项不出现？ 

26 - 利用习题 2S 以及习题22中的论断证明一个类似 T 复对称矩阵的 Takagi 分解 (4. 4. 4) 的 
复斜对称矩阵的 分解： 矩阵 AeM ,, 是斜对称的 C 4=—.4 T ) 肖 [1. 仅当存在一个酉矩阵 L / eM ,, 使得 
A =[ 川） @…㊉0❿\ © … ① A*)u 7 ， 

其中每个冇形式 ( 4 . 4 . 14). 特别地，可得出一个斜对称复矩阵的秩一定是偶数. 

27•设况 eM „ 是给定的 w 矩阵. 证明， u 要 /\ eM , 适合就一定存在酉矩阵 
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VGAU 吏得浐和提示：如果 W = 其中 [/ 是再矩阵 ， A = diag ( e ,s * , 

…，，-1 ) ，且考虑自然平方根 A ? 三 diagiyV 2 , …，/，）， fi 设 VsiMnu *. 
证明 WM = A 祀当且仅当丛与 t / Vlt ； 可交换.或者利用 （1.3. 12) 证明中的证法证明， V 是 W 
的多项式，由此推出丄 ： 与可交换，因而 V T A=AK 

28. 对推论 (4. 4. 4) 的又一个证明的下述要点给出详细的论述.记号和假设如 （4. 4. 4) 中所 
述.这实质上是 Hua (19«)的证明. t 先假定 A 是非岢异的. （ a ) AS 是 Hermite 矩阵，且它 
是正定的(对所有 reC ", ( A ^')^ O ), 因而存在一个两矩阵和一个非 

负非奇异对角矩阵 SeM , 使得 = l 2' A 2 是两矩阵且 2 W 是对称矩阵， 

因而 ( c ) 利用27题证明 ，行 在一个酉矩阵 VeM ,』 使得铲=识且2¥ = \^^. ( d ) 
Z - = { IV ) V = V r 2 V , 故 A =(2 V r )2( ZW . 设 (^若义是奇异矩 

_阵，利用习题2开头的论断把 .4 化为非奇异的情形. 

进一步阅读与注释关于推论 U .4.4) 的原型既可参看 T . Takagi , "On an Algebraic 
Problem Related to an Analytic Theorem of Caratheodory and Fejer and on an Allied Theorem 
of Landau ," Japan. J. Math, t (1925)，83-93， 也可参看 I . Schur , “ Ein Satz uber 
Quadraiische Formen mit Komplexen Koeffizienten, " Amer . J.Math. 67 ( 1945) , 472-480 .另 
给的几个证明可参看 C ‘ L . SiegeU "Sympiectic Geometry ,'' Awer . 7, Mu/A 65 (1943), lemma 
1， pp . 12, M-l 5 : L . - K . Hua , “ On the Theory of Automorphie Functions of a Matrix 
Variable I-Geometric Basis , J.Math. 6 ^ (1941 > , 470-488； 及 N . Jacobson , “Normal 
Semi-Linear Transformations ," Amfr . J. Math. 61 ( 1939)，45-58. 用气角约化 （4. 4. 3) 证明 
(4. 4. 4) 可参看 Y . P . Hong and R . A . Horn , **On the Reduction of a Matrix to Triangular or 
Diagonal Form by Consimilarity , M S 7,4 M 7. Algebrau and Discrete Methods (to appear ). 关于 
推论 （4. 4. 11) 到任意 域的推 J " 可参看 (), Taussky * “The Role of Symmetric Matrices in the 
Study of General Matrices , Linear Aigebra Appi. 5 ( 1972), 147-154. 

4.5 Hermite 矩阵、对称矩阵的相合与同时对角化 


任一二阶线性偏微分算子 L 可以写成形式 

诸低阶项， DCR", (4.5.1) 

其中，假定系数\ (>r) 定义在某个 K 域 DCR" _h， 函数/在 O 上二 次连续可微.正如在 
(4. 0. 3) 所看到的那样，我们不妨假定，对所有系数矩阵 /IU) = |>,, U.)] 是实对称矩 
阵.我们所说的低阶项指的是只包含/及其一阶偏导数的那些项. 

如果作 S 变量到新变量；二 k]6DC；ir 的非奇异变换，则每个& = [_r] = s , (XM …， 
4>，而非奇异性则说明 J aco bi 矩阵 

在 D 的每一点非奇异，这个假定保证变 M 1 = ^(*.) 的逆变换局部存在.古接应用链法则可证， 
m 在这些新坐标下，算子 L 有形式 
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1 ■卜訊 矣旮 4] 或+_诸低阶项 


+睹低阶项. （ 4 . 5 - 2 ) 

闶此， （ 在坐标 i — kTF ) 新的^数矩阵月与（在坐标，一「/. 1下 Htl 的实系数矩阵 A 的 关系可 
用关系式 

B = .SAS r (4. U 1 ) 


表示< 其中 S 是非奇异实矩阵. 

如果微分算子 i 与某个物理 定律冇 关(例如， UpWv 算 = F 和静电势），尽管对 S 变 
M 的坐标选择显然会影响 L 的形式.但它决不会影响该定律.因此*我们不禁要问，通过关系 
式 (H 3 T ) 与已知矩阵/\相关联的所冇矩阵 B 的集 合具冇 么不变量. 

另一个像 (4.5. 3 7 )那样的变换例子来源于概率与统计.假定在有期望算子 E 的某个概率 
空间上， X ,， X ::，…， 又 是具有二阶矩的实或复随机变量. II 设 p = 表示相应的平均 

值. Hermite 矩阵 A=[\]:(E[(X.-. 户,）（（-."」）]) =Cov(X> 是随机向 错 X; [A ，…， 
的 协方差矩阵. 如果 s=[. v ]eM„ 是给定的矩阵，则 sx 是其分骨为的诸分量的线性 
组合的随机向 ft . sx 的诸分量的平均值是 


E( (SX),) = E( 2 ^-v-Vi) 2 'vm) = i'V / 八， 

/f 1 i- J i=l 

而 sx 的 协方差矩阵是 

C ： ov ( SX )- ( f ：[(( SX ), - £、（（从），））（（雨）」—^：((兩）,））]) 

/ V- l 

^ ( 士 - ( tvu '、） 

p-T I i，-、i I 

= SAS '. 

这说明 


(' nv (. SX ) - . SCovC . X ^ S 1 . U ‘ 5. a •) 

因此，随机向 ii 的协方差矩阵的变化规律与 （ I . n ) 稍有不同. 01是，如果矩阵 s ' 是实的，它 
便简化成 (4. 5.3 ，r ). 

作为最后一个例子.考虑一般二次 M 

Q 1 ( 」 ） 二 ti w ?'■?'. - A./ ■ .f J 6 C ’ f ， 

J - 1 1 

以及 Hermite 

"〆 ，，）一 V /} 7 / j r i\ --- t ；ir * .r - t (:、 

其中丨 I 如果是给定的矩阵，则 

Q 1 (-S.i ) — (.Sr )M (: St ) -t 1 ( S: \S .Ki -- Qj 
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H a (& ) = (S.r) 1 B(Sji) = (S' KS).r = 

在这个例子中， A , S 和 . r 为究 的或为复的是无关紧要的.这里，有两种稍微不同的变换 

规律在起作用，而这 TH 是给出 F 述定义的理由. 

4. S .4 定义 KA , / ieM „ 是给定的矩阵.如采存在非奇姑矩阵 S 使得 

( a ) B = SAS ，， 则称 B 是•相合（“里相合”）于 A , 

( b ) y ^ sAs 1 ,则称 Ji 是 1 相合 rr - 相合）丁 -/L 

显然，这两个相合概念肯定有密切关系；如果 s 是实矩阵，它们是相冋的.，[^分这两个 
概念是 x 关紧嬰的时候，采坩术语相合，而不加问头.有些作古用术语 共轭相 合表示•相 合， 
而我们采用更便十 id 忆的术语. 

练习证明相合的矩阵有相 N 的秩. 

值得提出的是，如果 A 是 Hcrmiie 矩阵，则 . SAS _ 亦是 Hermite 矩阵（即使 S 是奇异钔 
阵）；如果 A 是对称矩阵，则也是对称矩阵.通常，对保持 fe 阵类型不变的相合感兴趣， 
例如，关于 Hrrmite 矩阵的‘相合和关于对称矩阵的 1 相合. 但是，如果 A 是实对称矩阵，则它 
是对称矩阵，也是 Hermite 矩阵； 丁-是 SAS + 是 Hcrmhe 矩阵，而 S /\ S T 是对称矩阵.对于实 
_ 对称矩阵，我们可能想按和关的内容来考虑'相合或 1 相合.这两种相合共冋其有一个重要的类 
似性质. 

4. S .5 定理’相合和'相合都是等价关系.即对任 _ 

U ) A ^ A 相合. 

Cb ) 如果 A 与 R 相合，则 B 与,4相合. 

( c ) 如果 A 与 B 相合且 fi 与(：相合，则 A 与 r 相合. • 

证明：对于 ( a ), 我们把 A 写成 /\ = Mr . 如果 A 二 SRS '， H . S 是非竒异矩阵，则 B = 
S ' A(S M *. 最后，如果 H . B — S 2 CS 2 - ,则 A —( SAOdSpS )' 对十 T 相合的 

证明形式上是相同的. □ 

W 此，所有矩阵的集合按相合关系划分成等价类.作为一个理论问题， 叮以 在每- 
相合关系下找到每个等价类的一个标准代 表儿. 这个问题对'相合更复杂一些，所以先讨论这 
种情形. 

通过积别相合关系的诸不变 tt 可以辨认并划分各微分算子，这个实际问题促使我们太分析 
研究由（经实矩阵 S ) 相合于某个矩阵的诸实对称矩阵组成的等价类的标准代表元问题.结果证 
明，这 个问题 有一个简单的解答：只要计算正、负特怔值和零特征值的个数. M 为这个理由， 
引进下述专有名词. 

4.5.6 定义设 Af M , 是 Hermite 矩阵 .. A 的惯性足有序元组 
i ( A ) - (；' ( ( A ), i ,( A )), 

其中，^ ( A ) 是 A 的特征倌的个数，， （ A ) 是 A 的负特征值的个数， 4) 是 A 的零特征俏的 
个数，并11都计相重特征值的个数.注意， A 的秩等于，， （ A ) + 2 _ ( A ). A 的符号差等 f 数值 
? I ( A ) — CA ). 
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练习证明，加果知道 A 的符号差和秩.则 Hernike 矩阵 A 6 M W 的惯性是唯一确定的， 


反之亦然. 

如果 AeAl 是给定的 liermite 矩阵，则 A = ，其中 A 二 di a g ( A ,， …，而 U 是西 

矩阵.为方便起见，假定 A 的诸对角元中 t 宄出现的是正特征值，然后是负特征值，最后是零 
特征值.于是，，八 t …， A r ^ >0 ? A r , _ r <0,而 A ,_ ,, _h =…=夂 = 0.如果令 

D — diag(-[- v ^ T ， …，，十 A」.] ，…， 十八― A 、' ，1 ，…，1) 

则 D 是非竒异实对角矩阵，叵 ' 

"1 

1 0 

-1 

A - D D , 

1 

0 0 
_ 0 _ 

其中所展示的矩阵恰好#匕（八)项“十1 ”， i ( A ) 项1”和 ：( A ) 项 “0”. 于是，矩阵4可以: q 成 

「 0 1 


A = UAU - - S 


0 


5' S1 ( A ) S " , (1.5.7) 


L 0 」 

其屮 S = f 7 D 是非奇异矩阵，而 /( A ) 是 A 的惯性矩阵.因此，每个 Henrnte 矩阵‘相合于一个形 
式很简单的对角矩阵，只要知道了菡矩阵的惯性，便知道了这个对角矩阵.用惯性矩阵作为*相 
合 fA 的矩阵等价类的标准代表元应当是有吸引力的，不过，要做到这一点，必须确认‘相合的 


Hermite 矩阵有 相同的 惯件.这正是下述定理的内容，通常称该定理为 Sylveto 惯性定律. 


4.5.8 定理 '& A , 职紙是 Hermitf 矩阵，則存在非奇异矩阵 Se 使得 A 二幼义，与且 
仅当 A 和 B 有相 M 的惯性，即有相同个数 的正. 负特征值和零特征值. 

证明： 如果 A 和 B 有相同的惯性，则每一个矩阵都可表示成形式 （4.5.7), 其中每个矩阵 
的 S 可能不同，但却有相 N 的惯性矩阵.因为合关系是传递的，乂 A 和 iT 相合于同一个矩 
阵，所以它们彼此'相合，这正是要证的逆命题. 

假定 .4 与 R •相 合，且对某个非奇异矩阵有 A = SB 义. 因为相合矩阵有相同的秩， 
所以 h ( A ) ’匕 （£ i ) ， N 而只需证明 i + ( A ) = f | ( B ). 设 I ] , u ；； ，…，\ ( Jll 是 A 的相应于 - 正特 
征值 A [( A )， …， A,,a ( A ) 的正交单位向鼋，另外设 S , ( A ) — SpatiU , …，”， lt , 
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s , ( a ) 的维 数是； * ( a ). 又如果 则 u r -+ '… 

十 tA) ( A ) I a r[ ( , i , | 2 >0. 另一方面， 

/ = (S 1 ^)' B(S'x) > 0, 

因而，对于具有维数 ( A ) 的 SpaWn , …，中所有非零向有 V 心>0.根 
据推沦 (4. 3. 23), 必须有^ ( B )>^ ( A ). 但是，因为 A 和 B 在这个证明中的作用可以颠倒过 
来，所以得出 14 ( B)=i W ). □ 

练习设 A 6 M ,, 是 Hermite 矩阵.证明 Y 相合十单位矩阵，当且仅当 A 的所有特征倌都 
是正的. 

练习设 A , 是对称矩阵，证明 A 和可经复矩阵•相合，当且仅当它们可经实矩 

阵相合. 

练习设 AS 6 M „ 是实对称矩阵.证明 A 和 B 可经实矩阵相合，当且仅当 A 和 B 有相 
同的惯性. 

练习在由复 Hennite 矩阵所组成的集合中，在'相合下有多少个不同的等价类？在 
由 nXr ! 实对称矩阵组成的集合中呢？ ' 

由于 Sylvester 定理保证在‘相合下 Hermite 矩阵的诸特征值的符号不变，从而完全解决 F 在 
’相合下从 Hennite 矩阵的每个等价类选取一个代表元的 问题. 但是在•相合下诸特征值的大小如 
_ 何变化呢？利用 Weyl 定理 (4. 3.1) 最简单的形式，可以给出 Sylvcsta ■定理的数量形式 . 


4. 5.9 定理 （ Osirowski) 设 A, S£M„, A 是 Hermitc 矩阵，而 S 是非奇异矩阵 . SA 和 
SS •的诸特征值按递增顺序 U. 2.1) 排列.则对每个 i = i, 2, … ，存在正实数札，使得 A, 
(SS* )且 

A^SAS' ) = (4.5.10) 

证明： 首先，若 SSVsA-r & 乒 0 ，则 A = (.SV)Ark>0 , 因而 

W 的所有特征值都是正的 . 设々是某个整数 * fi 考察 Hermite 矩阵 A — Ai (A ) /， 

它的第 A 个特征值是零.根据 Sylvester ■ 定理 （ 4. 5.8), SC A - A* (A) 7) S * =SAS* -A t (A)SS* 
的第 i 个特征值也是零 . Weyl 不等式 U. 3 . 2 ) 说明， SASiA t M)SS k 的第々个特征值有如下 
的上、下界 


或 


k 


A t (SAS* ) +A,(-A t (A).S.S'* )<A*(SAS* -A ( (A)S.S* ) = 0 

^A*(S.AS' ) f A„(—A t (A)SS ‘）， 


A*<SAS' )<—A〆—- 夂 （ A)SS 


Ikau^ss.) 


A„(A t (A)S.S* ) 
如果 >0, 
如果 A,<A) <0, 


A*(SA.S- )>- A t (A).S.S 


) 二 A, (MMSS 1 ) 


|A*(A)A, (SS -), 如果 A*(A)>0. 
U(AU„(SS *). 如果 _UA)<0. 
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在任何一种情形 [A t (A)》0 或者 MA)<0J 下.这些不等式都推出 A*(SAS’）=0 山 （A)_ 对适合 
A,(SS* ） 的某个 & 成立. □ 

在 Ostrowki 定理巾，如果 A = /6M„ ，则所有 A“A) = 1 &A=A f (SS'). 如果 S€M„ 是 
酉矩阵，则 AJSY )=A„〔SS‘）= 1 fi 所有& = 1;这表明在酉相似下特征值的不变性.因此， 
定理中给出的关于么的界对任一给定的4和任一给定的非奇异矩阵 S 是最合适的. 

通过简单的连续性论证， Ostrowsk! 定理可以推广到包括 S 是奇异矩阵的情形.在这种情 
形，设^>0,然后用 S + W 代替 S 来应用定理可知 A,((S + d)A(S 十 £ /)‘并且 
A^tS+sDtS+eJ)* )<A<A„((S^£iKS-re7)-). 现在让 c-^0 便得到界 0<i? t <；u(SS ■乂 
这个结果可以看作 Sylvester 惯性定律到奇异•相合的推广. 


4 . S .11 推论设 Aje 且 A 是 Hermite 矩阵.设 A 和 SS ' 的甫特征值按通增顺序 
(4.2.1) 排列.那么对每个々 = 2，…，存在非负实数 ft 使得 AJSS ' XftgAJ . SS * ).R 

Ai (. SAS * ) = 6 1 山 (-4). 

特别是 SAS - 的正（负）特征值的个数小于或等于 A 的正（负）特征值的个数. 

求复对称矩阵在 7 相合下的诸等价类的标准代表元问题有一个更简便的解法：只要计算秩. 


4.5.12 定理设 A , 是（复 或实） 对称矩阵.那么，存在非奇异矩阵 S 6 Af , 使得 A = 

SiiS T , 当且仅当 A 和 B 有相同的秩. 

证明： 如果 A = SBS T , 且 .S 非奇异，则由 （0.4. 6) 可知， A 与 B 有相同的秩.反过来，利 
用 （4. 4. 4) 可导出 

,4 = U, v, U'{ ^ 17, KS, )D'iUl = O/, D i )I(S l )CU i D ] ) T , 

其中，是名的惯性矩阵 U .5.7), 它由 A 的秩完全确定， U , 是酉矩阵， L = di a g ( CT ,, 
办，…，〜）且所有 1 > 0 ， D , = diag ( J , , d 2 , ■- ,尤）且 

^ _ J -/ tJi ) 如果 a , > 0， 

1 1.1, 如果 <7, =0. 

注意， Q 是非奇异矩阵.也可以用 N 样的方式导出 B =( U 2 D 2 U ( 名 Kt /: D Z )7 ',且其中各矩阵 
有类似的定义.如果假定 rank 4 = rank 则/(名 ） =/(么 ） ，且 

/(2i) = = 1 ( 2 ,) = (LUM - 

H 此 

.-A 二 ( U . DjK ^ D ,) 

由此得出 A 与 B 1 ' 相合. 口 

练习在 7 相合下，复对称矩阵组成的集合中有多少不同的等 价类？ 在„\«实对称 
矩阵组成的集合中呢？ 

练习设 AeM , ，是对称矩阵.证明疗4:非舒异矩阵 seM „ 使得 .4 = iS T . 当且仅丐 A 是 
非奇异矩阵. 

练习设 A ， 是对称 矩阵. 证明存在非奇异矩阵 X . Y 6 A 1 使得 A 也就 

适说，等价，当旦仅当存在非奇异矩阵使得 A = SRS 7 , 即相合. 提示： 
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如果 A = ZHY , ASH 的秩是什么关系？ 

上述结果相当于关于复矩阵的 7 相合的 Sylvester 惯性定律. 卜 述结果相当于 Sylwster 定 
理的 Ostrowski 数最形式 L (4. 5. 9 >和 （4. 5. 11 )1. 

4.5.13 定理设 A . SGM ,,, 且 A - A j .设 A = LE (7 T 和 SAS f - VMV T 是 A 和 SAS r 的 
Tak 叫彳分解 （4. 4. 4)，其中 （7 和 F 是两矩阵. 2= diagh ，&，…，& ) ， M = diag (^ 1 , 

…，内）.且所有… ".>0. 设尤 GSS +) 表 /];_ SS •的特征值.假定数 c "，和 A , (,%'•)都按递 
增顺序 (4.2. 1) 排列.则对每个 A — 1, £，…， n . 存在适合丨 （ SS _ )<£ l ,< A „( SS ' ) 的非负文 
数久使得 p —如*.如果 S 非奇异，则所冇 ft >0. 

证明： 数 〆 足 Sir 的特征值.其屮 B = SAS '. 因 ffif 

^ = A〆 /® ' ) = A t ( SAS r SAS - ) = A t ( S [ AS r SA '| S - ) - W t ( AS T SA ) 

为得到最 R - -个等式，我们利用了 （4. 5. 11). 

W 为两个矩阵乘积的特征值与乘积 （1.3. 20) 的顺序尤 X . 乂因为特征值 A * 足 实数. 所以还有 
〆= W*(^S'SA) = W,<SAAS r ) - AA^CS.AA.S-). 

冉 K 用 U . 5 . Uh 则对适合 A , (W Kft < A „( SS * ) 的某个良有 
/d = d t d t x t ( AA ) - btptc ' t . 

因 此‘押 二 =札〜 ■且 此=/^1 _ 在 所要求的上 F 界之间 . □ 

我们从 （1.3. 19) 得知，两个可对角化的矩阵可经同一个相似变换 ㈣ 时对角化， 气且 仅与它 
们可交换.关 于通; U 相合 M 时对角化的相应结果是什么呢？ 

或许 ft 早是由于研究关于稳定 f 衡的“最小振动”力学问题■才促使人们去考虑关十通 过相合 
N 时对角化 的壳关 结果.如果动力系统的组态由广义 （ I ^ grangcO 坐标1，仍， ... ， g „ 来确定，其 
中原点是稳定平衡点，则在原点附近，势能函数 V 0 J 以通过川广义坐标 g , 表尕的实二次型 

V = 肌 

来逼近.动能： T 可以通过用广义速度1表示 S ? (实一次型 

T = 土 

来逍近.系统的变化过程由 Lagrange A 程组 

^T^j]V = 

所 决定. 它是常系数一-阶线件:常微分方程组，如果两个二次型 ： TflJ V 是非对角的，这些方程就 
是耦合的（因而要解这些方程足较困难的 >. 我们可以假定实矩阵八=[〜」和_8二[~]是对称的. 
如果可以求得廿.奇异变换 . S — 使得 SAS T 和 SfiS 1 ' 都是对角矩阵，则关于适合关系 

9_ - (4.5.14) 

的新广义坐标动能二次 型了和 势能一.次铟 V 都是对角矩阵.在这种情形， Lag range 方程 
组就是由"个分离的常系数二阶线性常微分方程组成的非耦合组.利用指数函数和三角闲数不 
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难解出这些方程，而原问题的解可利用 5. H) 求得. 

W 此.如果町以通过相合同时对角化两个实对称矩阵，则一类虽要的力学问题的实质性简 
化足可以实现的.根据物理知识，动能二次艰是 il: 定的.结果证明，这是可通过相合同时对角 
化的充分(而不是必耍的）条件. 

我 fflwj ■能要考虑的同时对角化结果冇多种形式 . 可能冇两个 Hcmiite 矩阵 A 和并且可 
能希望对某个两矩阵！/使和 imr 都是对角矩陴，或者可能满足于较弱的结果，对某 
个非奇异矩阵 6' 使 SAS 1 和 SUS" 都是对角矩阵.类似地，如果 A 和 B 是对称矩阵，我们可能 
希望 L/At / 1 和成 S,AS T 和5^^都是对角矩阵.甚至吋能会有这样的混合问题， A 是 
Hmnite 矩阵，而 B 是对称矩阵，希牮 [ML; •和㈤ U 1 ', 或 SAV 和 .SSS 1 都是对角矩阵.在 
毎种情形，要考虑的自然相合是保持相应矩阵的特殊代数特征的相合.所有这些情形都出现在 
砬用 之中.它们都可以用同样的技巧來处理，而要考虑的 M 筒单情形是两个矩阵之中有一个是 
非奇异的情形.在表 15 T 屮列出 r 若干结果，它对每种情形都给出一系列等价的必要充 
分条件.将这些必耍充分彔件按 指定顺 序编号逛为了显示各种情形中相平行的条件. 

4. S . 15定理设 A . Be — M , ‘ 是给定的.设 V肩小_西％阵， S 忐示彳 i : 命异矩阵.且 r /, M ,, , 

则冇表 4. .5. 1 ST . 

表 4. 5. 1ST 


对 .4 和 B 的假定 


B -IV 

A 是讵办界 Miff 


► A = A ' 

A 是佧奇铐矩阼 
(: A 


B = B - 

如米 A 是非苛异矩阼. 
令 C-A Wi 
如罘竒异矩阵， 
令 C=B A 


已对角化矩陴® 
U ) UW ： ^[VuUU 


关]' _可向时糾旬化的等价的必要 ft 分条件 


)存在酉矩阵使得是实对角矩阵 
(2 K : 有艾特征值戶酉对角化 
(3) C 是 【 Irrmite 矩阿 
{^\) AH = HA , 即 A 4 B 可交换 

UOSAY fll SBS ' U ) 存在阼电环矩阵 KeM „ 使得 iTH 是实对角妒阵 

实特扯值 apj 对角化 

( enJAU 1 和咖 T U ) 存斤洱阵 KeM , ; 使得 V f CV 是对角矩阵 

( z > r 足叶 两对 角化矩阵 
.规矩忤 


U ))5 A . S ' ^11 SBS ' 


UOUAU ^ ^1 V !^ u ! 


U 0 S .4 义和 SBS r 


u ) 存在卟奇异 m 阵 neM , 使彻 r 1 cr 是对角矩阵 
足可刈角化好，阵 

imw - r 皮是对角圯阵 

cnr 锆对称矩降 
i\)AH = HA 


存在非奇异矩阵使得 K 
存在非奇异矩阵 便得 R - 


l CR 是对角矩阵 
是对称矩阵 


证明： 在六组条件的每一组中，所述大部分条件的等价性只是属于定义的推论. f(a) 组 
中 （3) 和 U ) 的等价性可以从以下论断 推出； 如果 A 和矩阵，则是 Hcrmite 
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矩阵当 ii 仅当 A 可交换，以及 A 是 Hermite 矩阵当且仅当力」是 Hermite 矩阵.类似地 

可证明 IH ( a K 3) 和 （4) 的等价性，这是丙为，6是对称矩阵当且仅当 B 1 是对称矩阵，还因为， 
如果 A 是 Hermits 矩阵，则 A r = A . 

在六组条件的每一组中，条件 (1) 的必要性 可直接 从相应的相合具有对角形式的假设推出. 
例如，在情形 11( b ), 如果 SAS T = yl 和 SRS T = M 都是对角矩阵，贝 IJ 


|228 

：223 


A 'B = (S T A ! S)[S-'M(S T r 1 ] = S^A-'MiCS 7 )- 1 , 

因而 K = S T B 对角化 C ’ = A 类似地，在情形 T ( b ) 和 R = S •也将起对角化作用. 

如果 S 是酉矩阵.则每种情形的相应矩阵 R 也是酉矩阵. 

考虑情形1«其中 A 和£1是 Hermite 矩阵，且 A 是非奇异矩阵.假定 I ( b)(l ) 成立，即 
存在非奇异矩阵尺=[「山6 JW „, 毎个 r , eC ", 以及对角矩阵 AcdiagQ ,, …， AJ , 
其中所有 A , 是实数，使得 J ? 因 W 且不失一般性， 

假定相重的 A , 项的值是排放在一起的，因而 A 有分块形式 


71, £ i 




A ^ 

0 


0 


L Aj 

1 < n ； < 7 i ! A , = pt .,1 , i = l ,2 r -, k . 


(4. 5. 16) 


其中，所有 p 是实数，且如果 *# j '， 则叫？如果所有 A , 项末必相等，选取适合 X 
«的任意 f . 』使；1,垆1，丼且考察恒等式两边的；，_/项.这就是 
r.'ArjAj = r ； Br, = r ； Br, = r ； Ar,A, = r,Mr 入， 

这里，用到了 A 和是 Hermite 矩阵（因而对所有有 x ' 以及 A , 和 A , 是 

实数的事实-因为 A , 尹勾 ，我们推出 闵而 = 这表明矩阵 

和 i ^ Ai ? 都是分块对角矩阵，且与 (4. 5. 16) 有相同的 形式； 即 

0 _ 

= R * ARA 
B k _ 

0 I 


其中，对；=1 ， 2 ,…， h B ,.， 这部分化简到对角形式，如果6 即如果所有 A , 

都互不相同，它将完全化简成了对角形式.如果则某个子块有《,>1,且因 
为 A , ■和 B , 是 Hermite 矩阵，可以利用谱定理 （ 4 . 1. S ) 导出 A , = t /,. D ,. t ；,' ,其中(7,， D ；^ M n , 
r /,- 是酉矩阵，而 D , 是实对角矩阵，则 B ,= AA ,= Lr ,(^ D ,) U ,* 也可对角化.如果令 
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i 

$ 

o 1 


D' 

0" 

! 

i ] 二 1 

i 

0 • 

i ， 

、 1 

u k \ 

D = 

D, 

0 ' 

■、J 


托当= 1时 t /, = [1：]， 则 L 「 是酉矩阵， £) 是实对角矩阵 ，辻 

R-BR=- U(DA)U' , R\AR = VDU' . 

最后，.欲求的表示式是 

.4 = L r ] D [( i ?- 和 13 二 [(K ^- c/KftDCcR ' riy ]*. 

注意，如果假定 I ( a )(1) 成立，证法是相 N 的，只是我们还知道 K 是时矩阵.在这种情形， 
(R M " L /= J ? L ； 是酉矩阵且 I UK 1) 的充分性得证 . 

余下的四种情形中所要作的证明是类似的.利用相应的假设得到相合矩阵，它们是分块对 
角矩阵，然后利用关于 Hermite 矩阵的谱定理或关于对称矩阵的 Takagi 分解 U . 4 4) 便完成了 
到对角形式的化简. 

考虑情形 I . 其巾. A 和 S 是对称矩阵，且 A 是非奇异矩阵.假定 II ( b )(1) 成立，即存 
在非奇异矩阵 每个 r, ec , 以及 （不一 定是实的）对角矩阵 yistfega , 
心，…， A „), 使得 i ? [ A — 因而 BR - AiM 且 /? T BK = R T Ai ? A . 又假定相重的 A , 项是 
排放在一起的，因而 A 有形式 U . 5. 10,且所有^，互不相同.如果不是所有 A , 都相等，选取 
适合 j<n 的任意，_， j ' 并考察恒等式 R t BR = R t ARA 两边的；， j 元.这就是 

WAr 山「 rjBr, = rjBr, = r [ Ar , A , = rfAr 人 

这里，用到了 A 和 fJ 的对称性（对所有 1 ， y^C". ^Ay=y 7 Ax). 因1关 A ,， 推出 r , r A n =0, 
因而 rjAr^rlHrj-rjBr^O . 这表明矩阵尺和都是分块对角矩阵且与 <4. 5. 16> 有 
相同的 形式； 即 

0 — 

= r t ara 

B t _ 

0 1 


/ma i, J 

其中杜， A ,6 M ,,. 如果* = «，这就是所要求的化简.如果々<”，则某个子块有 r;,>l 且找= 
因为 A , 和坟都是对称矩阵.可以利用 Takagi 分解 （4. 4.4) 导出 A , =[/,：£, Ur ， 其中， 
U , , U , 是酉矩阵，而 X 是具有非负对角元的对角矩阵.于是 

VJ. 如果令 




r t br- 


"2 A 2 






u - 


Ih 


0" X 

. 2 — 

0 

L/J _ 




且当 1 = 1 U , = [ l ], 则 ti 是酉矩阵， 2 是(具有非负对角元的)对角矩阵，且 
- U (2 A ) L/ f 和 = VSU 1 . 


a 后，欲求的表 i 式是 

如呆假定 II U ) U ) 成立，则尺是西矩阵且(尺0 7 [；=异〖/是两矩阵，因此 [1( a )(1) 的充分性也 
得到广证明. 

在情形 1 U ， 证明需作一点 修改. 设 A , B 6 M „, 是非奇异的 Hermite 矩阵， B 是对称 
矩阵.假定 11( b )(1) 成立，即#在非奇异矩阵 KzhwJeAi 和对角矩阵 A = tli ag a , 
A „) 使得 iT!A ' BR -^ A . 因 而戚二 A/M 目现在假定模相 
同的； I ,项排放 ft -起使 / i 冇形式 


「山 


A = 


A 2 


0 




[2321 


其中 ，儿 




二 1，“.』， 


并 R . 对夂卜1, 2》『有 | 〆 ]= | " ⑴ | ，而如果【朽，则 | f 1关 | ，丨 . 如果 
不是所有 A , 项有相同的模，则选取适合,/<»和丨 Al | ， U , | 的仟意；， ； ，然后考察恒 
等式 IVBR = R - ARA 两边的！， j 7 il . 这就是 

r/Ar^j = rjBr, -= rjBr, ^ r ； 'Ar,X, r ； Ar,A, 5 
这里，用到了 A 是 Hcrmite 矩阵及 B 是对称矩阵的事实.于是| I A , l = I r ； Ar , \ 

I A , I , 乂因为 U I 妾 I 1 I , 由此推出 r ； Ar ,^0, 因而 r ；.4 r ,= r ； r iir , =0. 这表明 
矩阵犮 T Sli 和 /TAK 都是分块对角矩阵且与 (4. 5. 16) 有相同的形式，即 


~ B , 


R T BR = 


B , 


0 


= R* ARa, 


fV 
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" A , A , 0 

0 

A ( A t j 


其中，所有 B ,， A , A , eM „ , 且 A 二 a ,^0, 

Dj — diag ( p" ,, j , u ' e -> ，■-- 

所打 AeK . 如果 a = 这就是所要求的化简.如果 A < n ， 那么某个子块有 &>1 n . 玖= 

-4, 人 = fl | A , D -:. 因为 D , 是两对角矩阵，所以 D ,‘ = D i = D ； , = D ; *, 因而 

DIB , D , - a , D ： A , D ,. (4.5. 17) 

这 f 恒等式左边是对称矩阵 DJB , D ,, rflf 右边是 Hennire 矩阵且所有是实数. 
如果 a ,，0, 推出 1 〕 ,'.4及是 Hermilc ■矩阵，乂是对称矩阵.而一个 Hermite 矩阵只有在它是 
实矩阵时才能是对称矩阵.因而，如果 /. VA , D , 就是实对称矩阵.如果 1=0( 至 多对； 
的- 个值可能出现这种情形},则 D ._ A , D , 是 Hcrmite 矩阵，但不一定是实矩阵.根据谱定理， 
別每个 i — ]. …，是存在0矩阵[人 6 M „ 以及实对角矩阵 M ,， 使得 DM , D ,= L /, AU /,*. 如果 
d 则 (7, 可以选为实正交矩阵，这时 tL 

D/B.D, = a ,D ： A,D, = II 如 M)UL 


5(1 果 a, = 0,则 U 「一 L ^ 可能不成立，但是，内为两边都是零，所给出的等式仍然正确.因此， 
对所有卜1，2,… . 4,冇 


A , - ( D , fJ ,) Al ,(/),(_/,)* fll B , = ( D 1 U ,)( ( T , M ,)( D ,[7 i J 7 . 

如果令 


pW 0 - 

lJ 肌 

0 ... 

I fU /」 



篇 

0_ 


0\ 1 

0" 

M = 

M, 

0 . 

K_ 

， Z — 

a 2 l 

0 • 

oj- 


则石 =[ (穴 1 ) T L ； li ： M [[7 7 R l ^ RA^：JR 1 )' r 7] JWLt /* Ji ], 这正是所要证明的，如果假定 m 
( a )(1) 成立，则 K 是两矩阵，因师 ( I ； l )' U = fiU 和（及'，[/二尺卩是酉矩阵，因此 (0( a )(1) 
的充分性得证 . 


， A 是非奇异矩阵时，这就完成了 I 的证明.如果 ij 是非奇异矩阵， [11( b )(1) 的假定说 
明‘存在非奇异矩阵侦得 M 是对角矩阵，因而 AK = ijJM 且 IT = 
黯- 此后的 iiK 明形式 h 与 A 是非奇异矩阵的情形相 | H J . 作证明中仅仅交换 A 和 B 的地 
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位，11用'1— ；1 1 (? ^分解（4.4.4)对角化；)/«,;),甜不是用谱定诨. □ 

在定理 (4. 5. 15)(^ l . S . 15 T ) 的情形 I 和 [I ， 有一个关于 .4 1 的熟知的条件，它等价十 
A 和 ； i of 通过相应的相含同时对角化.这就记 .4 可对角化（或阼其特征值都是实的），即 
A 具有形式 KA /(— 、其中 A 是对角矩砰（或迠实矩阵).原则这个条件可以通过验 
证 ,4 a 的极小多项式是怦有不 n 的线性(或许是实的）因式来检验.佴是在情形 m ， 所述条件是 
不多见的.即 A R 有形式 / il / L 1 ，其屮 j 是則角矩阵.这 f 条件说明,4 [ 3可通过合相似而 
不是通常的相似对角化.关十合相似性的讨论见 U . G )1 V . 定珅（4.6.丨1)证明.条件 （,1.5. 15 ill 
( bMl )) 等价于条件： CC 的特征值均 为化负丈数， Cf : 可对角化 . )t rank f^rank CC . 

在定理 <4. 5. 15) 屮作 非竒异 性假定 S 方 便的. 似是在酉相合的情形 T ( a ). II ( a ) 和 tn ( a ) 
中.这个假定可以取消 . 在情形 1( a ). 这种计算方法给出 r . XT 可 交换的 Hermitc ■矩阵可同 
时西对角化的经典结果 （4. i . 6) 的乂一个址明. 

4 . 5.18 推论设 A . 

( a ) 如果和都是 Hcnnitf 矩阵，则存: / r 丙矩阵便得 UA [厂和 UBW 都是对角 
矩阵，当且仅当3乃是 Hcrmite 矩阵： 即 

( b ) 如果 A 和 B 都是对称矩阵，则存在两矩阵 fJeM „ 使得 U 4 P 和 UBU 1 都是对角矩 
阵.当且仅当 -4 S 是正规 矩阵： 即 .AfiZM = BSA 見 

( c ) 如果 A 是 Hermite 矩阵，而 B 是对称矩阵.则疗在 g 矩阵 U ^ M „, 使得 U 4 LT 和 
l /肌" 都是对角矩阵.当且仅当灿是对称矩阵：即 

证明：如果 [ MU *— 和;：7/儿厂都是对： ff ) 矩阵.则 .4 —R = U * M [7, m 
而 = AUIJ ' MU - U - AMU-V MaV =- U - MUU ' AU = BA . 反过来，如果 AB ^ BA , 
则对某个 e >0. + d 是非命择 H ( , nmu = 矩阵.且.二 .+ 

-ri(A + e I)^BA s . W 此， /i 和 I „] ■交换，因而 .乂 j 足 Hermit c $ 阵根据 u.5. 15) 
(表 -i.S.LT) 的 r (a)(3). 存在酉矩阵 f; s . 侦得 （VU.V -U r AU ； U — 土 和 r 人机 7 : —M f 都 
是对角矩阵， 1A1 而 L/ e ALV -A s -s.I flJ U.LiU ； : M ; 都是对角矩阵. 

Cb ) 如果 UAt " 和 UBf/ r = M 都是对角矩阵.则4 = [/.,10 ， B = U ' MU , E AB = 
U -, liX n MU = f /’（ AMH / 可 FJ 对角化.因而足正规矩阵.又 T 逆命题，假定 AS 是正规矩阵 
t 4 A 是非奇异矩阵，则 AS = ( / 是正规矩阵 ， [fiK H 15) 的 H ( a )(3) 说明，两个对角 

矩阵 A ，和 K 是同时 fi | •酉对角化的.因此， 存弁: 两矩阵和对角矩阵 A ， M € M „, 使得 
/i 1 =[ MU T 和 S 广于是 .4 = ill 1 L ; ' 和 B -- UMU r , 这正是所要求的 A 和同时对 
角化形式.如果是奇异矩阵，则根据 （. L . 4 . 4 〗 ，存在 W 矩阵 [ J & M ,,， 使得以41^是对角矩 
阵，如果必要，还可以交换 U 的诺列使得 

2 e m ( ,丨 

如果把 ubu t 写成相应的分块形式 


UAV 1 ' 


且2是非奇异对称矩阵（实际上是对角矩 阵）, 
L 邱 s ,„ J ' 


UBU 7 


Bu e m ( . b ,, e , 
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则子块和是对称矩阵，目.有 


⑽的 ([»)=■(,' = F T 11 化] 二^風 q . 

-lo oJLb ,-, 知」 L 0 0」 

但是 fMM [厂还是止规矩阵. UI 而 2 S l; = 0( 见本节 末习题 20), 又因为2是非奇异矩阵，所以 
Br .- O . 这说明 


1-1 


uAir 


'2 0-] 
-0 0」、 


( tMU T ')( DBt 7 T ) - 



根据上 述关于 非竒异情形的证明.得知.存在两矩阵和对角矩 阵九， A , eM t( 使得 
W 为是对称矩阵，我们还知道，存在酉矩阵 K 6 M ,, t 和对 
角矩阵 *, 使得 达广 v ；^ v T . 如果设 M = A ,©； i i( 

则有 UALFdV ' 1 ， UBU T = VMV ! . 因此，乃 =(tr \ OA ( C " W 和 B = W V ) M ⑴ . V ) 7 " 
是所有要求的同时对角化形式. 

( c ) 如果 [7 AL ;' 二 A 和 = M 都是对角矩阵，则 A — 定是实矩阵 .^ A = U - AU , B 
=!T MO 以及 


AB= U' AUU ‘ MU - U • AMU - [；* M\U 
- [/" MUl； ! AU - ([；" = BA. 

反之，如果则对某个^>0, A 卢 A + d 是非奇异的 Herrmte 矩阵， 且八 B = 
\ eD^HA,. 闲此， U . 5. 1 5) 的条件 HI ( a ) (1) 被满足， H _ 存在酉矩阵[人 6/ W „ 使 
得 V t A t V； ^-11 Ml； = 和 VSUJ-M, 都是对角矩阵，因而 U , A [/； =土一 J 和 U,BU： 

- m £ 都是对角矩阵. 口 

两个奇异 Hermite 矩阵经(不-定是 西的） '相 合同时 对角化的问题在习题8中讨论. 

我们已经看到，在‘相合 F ， 一个 Hermhe 矩阵总可以取非常简单的形式（在对角线上有 
士 1或0的对角矩阵 >,并且，在一定的条件下，一对 Hermitc 矩阵经■相合可以同时变成对角 
矩阵.丁-是_自然要提出的问 题是： 一般的 Hermite 矩阵偶,4, M „ 在同时 * 相合下可以变 
成什么样的标准形？即经 C 一次相合.矩阵偶 
AC 和 

可以取什么样的标准形？ M 然这个问题是针对（可能都是奇异的）一般 Hermite 矩阵偶来讨论 
的，但是不论是提出还是证明其一般结果都是相当复杂的.这里，对其中至少有一个矩阵是非 
奇异的 Hermite 矩阵偶，不加证明地叙述标准形偶定理‘我们已经讨论了可经 * 相合同时对角 
化的特殊情形. 

4. S. 1! (定理 假定 A，Be 是 Hermite 矩阵，且 A 是非奇异矩阵.则存在正整数 A 和非奇 
异矩阵 C 6 M „， 使得 
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"A, 

0 


r B, 

O' 

C' AC - 

0 . 

A,. 

, cr bc = 

B ， 

0 . 

仏 . 


其中， 每对 A, ， BAM，, ， ； '-1, 2, k, 是两种可能形式之一 : 


且 </ 是实数，或 



「0 a 

1 

"0 1 

B , -e 


， — E 



ol 


_1 0 


B , 


， A, = 


{ U 5 * 20 ) 


( i . 5*21) 


巨 a 是复数 . 在 （ 4. 5.20) 中 e 是 卜 1 或一 1, 而在 （ 4. 5. 21) 中〜 是偶数 II .两个非零子块都在 
中， 

说明： 

1 在《是实数的情形，吋 能有％ = 1 ， T 是两个 f 块具有 形式丄 a , ±1. 相应十同 个 „ 
值（例如还相应于同一个值 e=]) 的多个 ixi 7 *- 块，在 C* K? 中将产生形如 Q j 的子块 ，咖作 
CMC 中则是 7. 

2. 在 a 是复数的情形，可能％二 2 ,十是两个子块具有形式 



3 . 在定理中，冏时产生的子块结构恰好对应十 .4 ' 的知 n^ii 标准形 . 即 4 的诸基本 
Jordan 块恰好是 A; 【 B ,. 注意到 AC) _I ((：• BC ) 二 CT 1 (A ' B)C, 因而(：也是使 A -1 B 取 
Jordan 标准形的相似矩阵 . 于是定理所确认的形式叮以从的 Jordan 标准形求得（确定渚 
惯性因子 ^ 是不难的 ）. 


4 -5.22 注释就像两个 Hemiite 矩阵 A, B 在 ’ 相合 下的标准形偶 （ 4. 5. 19 > 类似干 A 1 B 的 
Jordan 标准形一样，关于两个实对称矩阵 .4 ，在实』 _ 相合下也存在一个标准形偶，它类似 
于 A 1 的实 Jordan 标准形 . 其中，形如 H. 5. 21) 的子块 ii, 用形如 （ 3. 4. 4 ) 的类似子块来代 
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替，而其他可能形式的子块取原来的形式. 

习题 


1. 设 A , B 6 M ,,, 且假定 B 是非奇异矩阵.证明存在 C 6 JW „ 使得 A = BC . 此外，对任一 
非奇异矩阵有 S 4 S +=( SBS ' X '其中 C 相似于 C . 

2. Sylvester 惯性定律 (4. 5. 8) 的证明巾较难理解的部分是要证明，若 D 1 和 D 2 是相合的 
nXn 惯性矩阵 (4. 5. 7 ) ,则它们有相问个数的止对角元.正文中给出的证明依赖于 Courant - 
Fischer 定理的推 i 仑.请对下述初等证明作详细的论述.假定 D 2 = S ^ D t S , 并且假定 Di 恰好 
有^个正对角元且至少有一个负对角元.假定的前. 、个对 角元和£» 2 的前 z 个对角元是正的， 

其中 t < n . 如证明存在一个非零向量 j 二[: t JeC 1 使得 工卜1 二…二 A =0及 

(Sr), =(Sr) 厂…=〔&),=0,然后证明.〆 D ; x>0 而 (Sr)‘ iMSiXO 从而得出矛盾. 

3- '& A , 都是士^^矩阵.证明下列四个条件 等价： U ) A 和 B 可经■相合同时 函至 

对角化. （ b ) 对某两个非零实纯 S 〜6, “A + 6 B 与 B 可经 1 相合同时对角化. （ c )/ l 和同时 
'相合于一对可交换的矩阵. （ d)A + A MS 合于正规矩阵. 

4. 试用定理 U . S . 15) 证明中的证明方法以及交换族定理 （1. 3. 19) 和 （4. 1.6) 证明定理 
(4.5. 15) 之 I ⑸的如下推广.设泌 1( 土，…， A *6 M „ 是给定的 Hermite 矩阵，其中怠是 
卄命异的，则存在一个非夺异矩阵丁 6 M ,」 使得对所有 L …， h : TA 」 丁是对角矩阵， 

当且仅当 U ) 对所有；==2,…， A , A " A , 相似亍实对角矩阵，且 W 是 
一个矩阵交换族. 提示： 设 C , = A : M , 且对于所冇 ; _ = 2,…， SCS — 1 是实对角矩阵.设 
认 = ( S . ) ' A.S 然后证明彳 B ,； ■ —个 Hermke 矩阵交换族. 存 在一个西矩阵 t ； 使得对所冇， 

= 2. -■ k , US , ‘是对角矩阵，而 T 二 US 是所要求的相合矩阵.相应于 （4.5. 】5)之 U ( b ) 

的推广是什么？ 

5. 由（4.114 ) 给出的具有实对称系数矩阵/1(^) = [%(1)]的微分算子1在点^6£|^^是 
椭圆型的，是指其系数矩阵 A ( x ) 是非奇异的 R 它的所有特征值有相冏的符号.称 L 在 . r 是双 
曲型的，是指 A (. r ) 是非奇异矩阵，且它的个特征值有相同的符号，而-个特征值有相反 
的符 P /‘ 试说明，为什么关于一个坐标系一个微分算 了在一 个点是椭圆型（或双曲型），则关于 
其他每个坐 标系， 这个微分算 f 在那个点也是椭岡增（或双曲型）. Laplace 方程 

给出 r 椭圆微分算子的一个例子，而波动方稈 

□"’ = _ 3 + 券-枭=。 

是双曲 型算了 •的.个例于.这两个方程都是在笛^儿坐标系中给出的.在球极坐标，柱面坐标 
或其他坐标系下，这两个方稈的差別就很大. 

6 -设 x 二[不，…，，…， u 是由具冇冇限二阶矩的实随机变量组成的 
两个 向量. 事实 t (见第 7 章）， x 和 y 的协方差矩阵都只有非负特征值.假定其巾至少一个协 
//差矩阵是非奇异的.证明存在实非奇异矩阵使得 SX 和 SY 的协方差矩阵都是对角 
矩阵.用统计学术语表述是，可以求得…个非奇异线件变换 s 使 sx 和 sy 的诸分量各不_ 
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相关. 

7. 利用习题1给出-:个或多个随 机向量 满足什么条件就能保证有一个非奇异线性变换使 
变换后的诸随机向量的各分量是不相关的. 

S. 定理 (4. 5. 15) 的情形 I. (b) 考虑了两个 Hermite 矩阵在至少有一个矩阵是非奇异的情形 
下经+相合同时对角化的问题.推沦 （4. 5. ]8a) 考虑了两个矩阵可能都是奇异的情形下用酉‘相 
合同时对角化的问题.若两个矩阵都是舒异的，则经（不一定是酉的）‘相合同时对角化它们的 
问题最终可化成 <4. 5. 15)，但必须考察这两个矩阵的两个零空间之交的正交补的件质.设 A， 
S€M„ 是 H erm it e 矩阵，&假定它们都是奇异的，设 A) 和 /V(B) 分别表示 A 和 B 的零空 

I'hJ. (a) 考察匕 □和 L □可以证明，存在一对奇异 Hermite 矩阵可经*相合同时对角化. 

(b) 假定 N(A) 门证明，若 A 和 B 可经-相合同时对角化，则存在一个实数 u 使得 
M 十 S 是非竒异的. 提示： 若 CeM 是非奇异的，且 dC=/l 2 , 其中 A 和瓜 
是对角矩阵，证明戍和土的零主对角元不会处在相同位置.你能选取 a 使得《土+/1 2 的主对 
角元都不为零吗？ （c) 利用 （b) 证明 


■0 1 0_ 


-0 0 〔)- 

A = 〗 0 0 

和 B = 

0 0 1 

Lo 0 0 . 


0 1 ()_ 


不能经^0合同时对角化. （d) 若 

N(A) f| N(B) - {Oi , 

又 “eR 不为零且 aA 十 B 是非奇笄的，利用习题 3 (b)’ A 和可经‘相合同时对角化当且仅当 
(“A+iH 可对角化且只有实特征值‘ （ e ) 若 （ li m ；V(A)nA/(B) 二々>1，设 U,. 

是 R" 的一个标准正交基，而其中的 { W| ，的，…， 《*:> 是? V(A)f(N(B) 的一个标准汜交基.若 
U - lu ,, u .,, Mu 16M„, i 止明 


AU = 


和 


U' BU = 



其中 A ' / V ( Y ) nW ( B ') = joh 而左上角的零子块是 iXA 的. 证明， A 和 B 可 

经‘相合同时对角化当且仅当, Y 和 S ' 可经‘相合同时对角化.虽然 A ， 和 ii ， 可能都是奇异的，倍 
它们的零空间之交适平凡的. （ f ) 试收集从 U ) 到 （ e ) 的信息来叙述并证明关于两个矩 
阵经'相合同时对角化的_般定埋. 

9. 如果 A , B € M „, Ufi 非奇异，证明可交换，当且仅当 .4 与 S 1 可交换. 

10 •证明 G U 和 L —J] 可经酉 ; 相合同时化简成对角形式，佴不能经18合同时化简成 

对角形式.试用 （4. 5. 情形 n a ) 证明中所采用的构造法实现化简， M 顺便求出实施这个化 

简的酉 T 相合矩阵. 




不能经 * 相合或’相合 N 时化简成对角形式. 
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12 . 设七 阳紙， I1A 非奇异.证明，下列条件中的每一个.是 A 和 B 在定理 （4. H 5) 
(表 4. 5. I 5 T ) 所指每种情形的假设下经相应意义> 的相合同时对角化的必要充分条件， 


情形 必荧充 讣条件 

"777； k 在 Hcrmirr 知阵 FtM Si 使得 H = AF 

I fb) 存在具有实特征 值的町 对角化矩阵 Fe_ M,. 使得 B = AF 

II U) 存在正规矩阵 FGAt 使得 S=Af' 

11(b) 存在町对角 化矩阵 使得 B = AF 

111(a) 存在刈称矩阵使得 B =AF 

mb) _存在叮合对角化矩阵 Ft . M n 使得 B=AF|_ 见 (4. & Z)」 


13. 设 A , 是对称矩阵（可能都是奇异矩 | 坪），曰假定存在两矩阵 L 76 A 1 使得 

= 和 UBU 1 =财都是对角矩阵. if 明存 ftK 矩阵 V 使得 BS —.4 W 1 提示： 如果；\ = 
diagtA !， A ? , AJ . 证明存在 两对 角矩阵 f ) 使得 A —/ M = ylZA 然后证明 
M = I !' MAU -- U AD , D,MU - AtU ^! D ； U ) B . 

其中认和 A 是酉对角矩阵. 

14- 利用习题 U 的必要条件 if 明， 习题 8(c) 的两个对称矩阵不能 经酉; 相合同时对角化. 
提示：计算和的第一列.利用 （.1. 5. lHb > 证明同样的结论更容易. 

] 5 .如果 /U 是对称矩阵，证明，只要 A 和 B 都是非奇异矩阵，习题13中经 T 相合 

冋时对角化的必要条件也是充分条件.提示：如果扣 Y 二 A (咒.臣/ V 和 B 是非奇异矩阵，则 
1 SAB 1 =[/且7=-1?[/'这便推出 AS 1 A = D 'AAB 两边取逆推出 A — l fi 是正规 
矩阵. 

is . a a , Bew „ 是对称矩阵 （ 4 能都是由异矩阵 k 并 (■]. 假定存在一个西矩阵 t /& Ai 使 
得和 = M 都是对角矩阵.证明 AA 弓； 招 可交换.通过考察习题 8( t ) 中的两 
个矩阵说明，经两「相介同时对角化的上述必要条付不是充分条件.用推论 (4. 4. 5) 证明，这个 
必要条件是充分 条件. 只要 AA 和 aS 都冇, i 个不同的特征值. 

17. 设 A , B e M „ , A 是 Hermite 矩阵， h 是对称矩阵，乂假定存在酉矩阵 l / fM ,, 使得 
[ X 4 LT = A 和 LfflLT 二 M 都是糾角矩阵.证明,4与可交换.通过考察习题 1] 中的两个矩 
阵说明这个可经 （’ 和 M 相合同时对角化的必要条件不是充分条件.试用推论 （4. 1. 3> 证明，只 
耍袖的所有特 征值亙 不相 M . 则这个必要彔件也足允分条件. 

】 S . 设 A , • Be - M ., . fiA 和《 £对称矩阼， A 还是作奇异矩阵.证明，如果广义特征多项 
艾 - H>H »个小 同的 零点.则-\和 「: i 可经 r 相合同时对角化.提示： A _ ! ij 的 
济特征值是什么？ 

19 -对 Sylvester 惯件定律 (4. IWfl ) 下述另一个证明作 详细的 论述.是一个非奇 
择 I i mm t e 矩阵，且 S f M „. 足作奇异炬陆.设 S — QK 起一个分解，其屮 q & 是两矩阵. 
ifif R 6 M , 是一个具仃 n : 七对角元的卜 .: 角矩阵（见 i fi .]). 证明.荇 OC.:;d ,则 . Sf /) -=;Q + 
( J —/) Q / i 是非奋异矩阵‘设 / Un : 二 S (;) AS ( fr ， .4 ⑴}和 A ( lt 是什么矩阵 ■■；> 因为 / U /) 是非奇 
异矩阵，！ L 1 ^ /由 G 变判 I 时.足连绾地变化-证明 Aun 与 / U 1) 打相问个数的 Jl :( 负）持 
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征值.对较小的^>0考察并论述一般的情形. 

20. 如果 A == KB^M k , 证明 A 是正规矩阵，当且仅当 B 是正规 

矩阵且(: = o . 提示： 计算/^和4'八，如果 c - oo , 则对于所冇 ( orcco — o , 
因而对所有\ Cr 二 0. 

2】.说明 <4. 5. 18 Kb ) 中所采用的证法也可以用来证明 U ) 和 （ c ) 这两部分. 

22. 设方 =0] ■…，是给定的复对称矩阵族，又设；, ; = 1, 2, 

k). 如果存在一个两矩阵使得对所冇的 ！= = i, …， h [ m . u 1 是对角矩阵，证明方是 
一个交换族.当4 = 2时这简化成什么结论， R 与 （4.5. 〗8 b ) 有什么关系？事实上，/ V 的交换性 
也足以确保淨经酉 1 相合可同时对 角化； 请参看本节末的“进一步阅读”屮所引用的 Hong 和 
Horn 的文良 

23. 设 j = jA M …，是给定的复对称矩阵族， : ^={ 8 ,, BJCM 是给定的 

Hermite 矩阵族，又设：丨 A . S , : ;， k't. 如果存在一个两矩阵 t/e M „ 使得每个 

和毎个 UBJ / 是对角矩阵.证明和 y 都是交 换族. 且对于所有, =1 ，…，^和所有 
) = 1，…， m ，/ VV 是对称矩阵.当 A = m = l 时，这简化成什么结论， R 与 （4. 5. 18 d 冇什么 
X 系？事实上，这些条件也足以确保 W 和 f 分别经相合同时对角化.请参看本节 末的“ 进一步 
阅读”巾所引用的 H ctl g 和 Horn 的文章. 

进一步阅读定理 U . 5. 9) 的 Ostrowski 的证明以及有关的结果可参看 “A Quantitative 
Formulation of Sylvester's Law of Inertia , " Proc. Nat. Acad. Sn. 45 ( i 959 ) , 740-744. 定理 
( 4 . 5. 25) 的另一种形式在 [ GLR 似]中给出；包括两个矩阵是奇异矩阵的情形的.个详细证明 
还在 R . C . Thompson 未发表的手稿中.有关两个' 以上矩阵同时对角化的结果可参看 
Y . R Hong and R . A . Horn , “On Simultaneous Reduction of Families of Matrices to Triangular 
or Diagonal Form by Unitary Congruence ," Linear and Multilinear Algebra 17 ( 1985 )， 
_ 271 -288. 

4-6 合相似和合对角化 


提出本节论题的动机来源于前两节的 一-个 结果.定理 （4.1. 幻刻化了所有形如 UiU 1 的矩 
阵，其中， d 是上二角矩阵而〖/是酉矩阵；为了现在的 B 的，需要把这个分解写成 IMU t = 
UAi] '■ 推论 (4. 4 . J ) 刻划了所冇形如 1 的矩阵，其中2是对角矩阵，而定理 
( 4 ‘5. 1S) 的情形 m 则要求下述知识：何时 - 个给定的复方阵可经变换 A —.SAS ，化简 成对角 
形式，其中 S 为某个非奇异方阵. 

44. 1 定义 设矩阵 /\， BeM „, 如果存在非奇异矩阵使得、就称力和乃 
合相似 （ Consimilar ). 如果矩阵 . S 可以取西矩阵，则称 A 和 B 酉合相似. 

如果、且是两矩阵，则 4 = 1 ^ UBU r ； 如果 S = Q 是复正交矩阵’ 

则如果是非奇沣实矩阵，则力二;?的 1 因此，合饵似 
的各种特殊怙形包括 1 枏合.，和合和普通的相似. ' 
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像普通相似一样，合相似是 Ai 上的等价关系.因而我们可能要问，哪些等价类包含7角 
代表元或对角代表元. 

4.6.2 定义 设矩阵 A 6 AC , 如果存在非奇 异矩阵 S 6 M 使得 S _\4 S 是上三角矩阵，则称 A 
可合三 角化； 如果可选取 S 使得 S 是对角矩阵，就称 A 可合对 角化； 称 A 可酉合三角化 
或可酉合对角化. 是指力 可以通过 fi 矩阵的合相似化简成所要求的形式. 

如果 AeAC 可合 i 角化，并 fts 1 AS = zl 是上 〒角 矩阵，刚由直接计算可知 ， zlZ = 
s 、 AA ) S 的诸主对角元都是非负的.因而， AA 的所有特征值都是非负的. 另 -- 方面 ，定理 
H . 4 . 3 ) 说明，存在酉矩阵 L / 使得 UAfP ^ UTU ：/ 1是三角矩阵. ㈨ 此，确定某个矩阵是否可 
经合相似化简成 1 1角矩阵的问题经解决丫. 

4-6.3 定理设 . AGM „ 挂给定的矩阵. 则下 列命题等价： 

( a ) 3可合 r : 角化； 

0.) A njffl 合：角化： 

(^) AA 的所有特征值都是非负实数. 

如果 A 6 M ,」 是可酉合对角化的，则对某个酉矩阵 [7£： M „ WA ^ diagUi , …， A „), A = 
UAU '- UAU r . 十是 A ’ ：（0/ i [；■')/ = UA 0 1 =- .4, 闪而 A 是对称矩阵、推论 

U . I . 4 )说明■逆命题也成立， ft 对角矩阵总珂以取非负的.因此，我们又解决了西合对角化 
的问题. 

4-6.4 定理 矩阵 AeM „ 可两众对角化.当且仅当 A 是对称矩阵. 

其余与合三角化和合刈角化有 X 的问题是有效地刻划那些可经一个不一定是两的合相似的 
可合对角化矩阵. 

如果/\6地可合糾角化 I 丄 S 1 AS = y \- t li 叫 U ‘…， A „)， 则 AS =& i . 如果… . U , 
其中每个这个恒等式说明 A .、_, 二对 T —1, …，》成立.这个方程类似于通常的特征 
向 M - 特征值方稈， 佴又 与它有本质的差別. 

4.6.5 定义 设 AC - M ,, 是给定的矩阵.如果对某个 A 6 C , 非零向 M 适合，就 

称 .r 为 A 的合特征 向量； 纯量 A 是 A 的合特征值. 

怊等式 AS —表明， . S 的每个非零列是 A 的合特征向最.因为 S 的诸列无关当 .11. 仅当 S 
1卜-#舁，所以得知，矩阵 A 6 H , 可合对角化，当 U 仅当它有《个无关的合特征向 M . 从这个 
意义上讲，合对角化理论完仝类似丁缂通的对角化理论. 

何是，每个矩阵辛少有一个特征值， a 它只有有限多个不冋的特 征值； 从这方面考虑，合 
特征值理论则大+相同.如果」 47'=；u_ ，则 p ,,, Aj --. A (^ 7 -)= e 对所有托 

R 成 々:. 因此，如果 A 是 A 的合特征值，则对所有 0&R ， 亦是 A 的合特征值.另一方面， 
如果 ai — 义丄，则八丄：!.-=/\(几7)--.4(1?)=^^— au — u r.r， 因而，只有当I 义是九為 
的特征值时，这个纯讀 A 才可能是 .4 的合特征值.例如适 Cn 4A= — 21，而 AS 
没有非负特征值，这个例子说明，有些矩阵根本没有合特 征值. 但是.巳经知进，如果 AGM,, 
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\ m , 且《是哿数，则 a 至少必有一个合特征值，这个结果类似 t 毎个奇数阶实矩阵至少有一个实 
特征值的事实. 

因此，与普通的特征值理论相反，一个矩阵可以有尤限多个不同的合特征值，或者它可能 
根本没有合特征值.如果一个矩阵有合特征值，有时为丫方便，从模相 N 的合特征值中选出唯 
一的非负特征值作为代表. 

刚才得到的关干合特征值存在的必要条件也是充分条件. 

4. 6.6 命题设 -46M„ ，且 A^O 是给定的，则 A 是 AA 的特征值，当&仅当+万是 A 的合特征值. 

证明： 如果 A>0, 对某个 j 彳0有 . 则沾 = [卜 Ad) ， 

vXA.r —Aj. 

反过来，如果对某个」'关 0, A,Ar = A . ( , 则有两种可能情形： 

(a) /b ' 和相关； 

( b ) 和』 X 关. 

在前一种存在某个 " eC 使得这说明 p 是/\的合特征值.另一方面_， A.r = 
AAj —A(AT)=AC / "Z?)- / iAJ-^./— I I ， 1 所以 i " i = f 在因为对仟意 £)eR， 

是相应亍合特征向量〆 o' 的合特征值，由此得出十及是 A 的合特征值.注意到八4(先)=/1(/\^)二 
A ( l )-)= X ( Ar ) & W 而，如果 A 是 A5 的申.特相:值，情形 (a). -定总会出现 

在后一种情形 （b〕 （如果 A 是 A7i 的重特征值.就可能出现这种情形），向 M.v, = AS + Vlr 
是非零的，乂因为 

，\y = A/\jr +VAAj- = A.;- — vAA.r = Vi(/Lr + -JX.r ) — vX v , 

所以是相应于合特征值 +vl 的合特征向莆. □ 

我们已经看到，对 AA 的毎个不同的非负特征值，都有 A 的一个相应的合特征向童，这个 
结 果赉 似于普通的特征向量理论. K 述结果乂 ffl 微推广了这种类似性. 

4. 6 .7命题设是给定的矩阵，乂设 I,，^,…， 々是 /\的相应于合特征值; U， 1， 
…， A * 的合特征向最.如果当时 ， U I萁 U 丨，则 U, , …，〜是 

_ 线性无关向1组. 

证明：每个是 / VA 的相应于特征值 t 丨…的特征向 M . 由十向 心是矩 
阵的特征向景，且根据假设它们的特征偯! A ! I . Ai ! ■ 岳两两不同的，所以由 

(1.3.8>可知它们是无叉的. ^ 

这个结果连同命题 (4 . 6. 给出/一个已知矩阵的尤关合特征向#个数的下界‘由此得出 
可合对角化的充分条件，，这类似 丁我们 所熟悉的普通的可对角化的充分条件.在定理 U .6. II ) 
屮要给川更-般的条件. 

4. 6. 8推论 S： A e M., 屉给定 的矩阵.如果 AA _ 有 A t V 异的非负特征值，则 A 至少冇/：个 
无关的合特征向 M . 如果则 .4 可合对 角化.如果 ^一^,则/ I根本没冇合特怔向 a. 
关十无乂的合特征向 w: 的个数的这呰界是可以达到的.对于 A - jja ). 这 a —个基本 
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人.= ■:- , 

L o ij _ 

AA=f ( O 以 1 作为它唯一的非负特征值.易知合特征向量方程 = 只冇实解，因而每个 
合特征向量也是特征向量，且特征 向童组 成的子空间是•〜维的.因此，对仟意适合1在々<«的 
整数可以用基本 Jordan 块的直和给出这样一个矩阵 A € M „ 的例子，使得 .4 A 有 A 个不同 
的非负特征值 a A 恰好有 A 个无关合特征向量. 

我们的 R 的是要给出-个使给定的矩阵可合对角化的简单条件，作为第一步，先证明下述 
引理.提出这个结果是因为，如果某个矩阵 A6M ,, 合相似于一个纯量矩阵，则 A = S ( AI)S i = 
AS.S 1 且 AA = AS § ' ASS - 1 ^ I A | ; f . 具有 ( AA 是纯量矩阵）这个性质的矩阵是构成可合对角 
化矩阵的基本子块. 

4- 6.9 引理矩阵有性质 / U _ = 7, 当吐仅当存在非奇异矩阵 SeJW „ 使得 A 二 SS 

证明： 我们刚 才已经 宥到，所述条件是必要的.为 r 证明它是充分的，对任意 tfeR ， 定 
义，，汴意到 

AS 0 =- ACc ,1? A j-^I) -= e ltf AA -r c^A - e^A + e-' 1 ! = S„. (4. G. 10) 

W 为 /! 只有有限多个特征值，所以存在某个 flfR 使得 一 f %不是 A 的特征值.对于0的这个值， 

\ = ，（A + f 2, ""1) 

是非奇异矩阵， a 由 （4. s . 10) 有\ □ 

我们现在可以叙述并证明可合对角化的必要充分条件了. 

4 . 6 - n 定理设 -4€_ R . 则存在非奇异矩阵 . S '6 M , 和对角矩阵使得身= 3/^，，当 
ii 仅当是具有非负实特征值的可对角化矩阵，且 nmk A = rank AA . 

证明： 所述条件敁然是必要的，因为 

AA = SAS - ' SAS 1 = S U |\ S 、 

且的秩与 A 的秩都是 A 中非零对角元的个数.反之，如果 AA 可对角化且有非负特征值， 
则存在非奇异矩阵 S6M ,, 和非负对角矩阵 AtM „ 使得 AA = SAS 、不失一般性，假定 A 中 
的相同对角兀都排放在一起，且 A = A ! /„, ㊉ A : • ㊉ ,其巾 、 G M ,,, 且 A I > A ; > A ; >-*■ 

> A ,>0. 于是有 


■S J A4.S - .S ^.SS-'A.S - fi' MSX^AS) : A 
如果令和 S _ H 则 （ 因为合相似是等价关系 〉 只耑证 明 . t DB = A , 乃 就可对角化.因为 Z 
是实矩阵， a — /\= ( 朋卜兑8—扯 I ，所以乃与0町交换. " p 是 m — 识郎）=£!朋=(邱）名= 
AB . 所以 / i 与』 也可交换.如果把 S 丧示成分块形式 

也，知 …/V 

n - : b , 2 ; ， 

A ，- '队 — 


\m 



K 中子块的阶数与 


0 


A = j ，/， e M„ ,{ = 1,2 , …，々 

i 0 A 丄」 

的相应子块相同，则方程 = 表明.对所有;_ = 1, 2，…， A 冇因为如果 
则又^^推出，如果/弇乃则战,=0,因而 B 是分块对角矩阵 
「从， 0 1 

叫 '.卜 

Lo vl 

ft 中，对角子块与 A 的相应子块有相同的阶数.方程表明，对每个；一 1, 2,…，左， 
注意，如果 A ,>0, B , 必定是非负矩阵.所以，如粜 A ,>0, 可以把这个方程写成 

因而可以利用引理 (4.6.9) 得出，#在非奇异矩阵 kS , ew „ ，使得虼 一 s ,( vH ,)5, ，•如果; u 二 
0 .则 1 

rank Zj M 十 rank 执』十 rank B M 

= rank fi = rank A 二 rank A 4 = rank J —〜+ , i? 十… \-„ t 
这表明枚 . t 的秩是零，所以如果 ; U = (), 则枭石._个于块凡*实际上必须是零子块.这时， ii 丁以 
把私*写成0二/^ = &(^/)义 1 , 艽屮 s t eM ,, 4 是任意非办矩阵.如果令 ①…㊉ 
那么所有情形都证明了 

h v / xr’i ® … @」 \' ) S "' , 

这正是想要做的. M 

当把 nf 合对角化的必要充分条件应用于定理 （4. 5. 15) 的情形 fll ( b ) 时，有 T 述推论.如果 
给定 A , lid A 是 IkrmUe 矩阵， B 是对称矩阵，且 A , B 中至少有…个是非奇异矩阵. 
按 A 或 B 是非奇神阵，令 g=A J 或 B ! A . T 是，存在非 t 异矩阵 S & M , 使得 SASH 
S 脱都是对角矩阵，那仅当 0 C ' ㈣ 化，其全部特征值是非负的 ， fi ra nk C^rank CC . 

4 是复对称矩阵的特殊情形容易通过定理 （ 4 . s . u ) 来处埤，因为这时 Aj4 一 .是 
Hc . mute 矩阵，因而可对角化‘另外，对任意 AeM„，rank A-rank AA * , 所以，当 .4 是复 
对称矩阵时，它满足定理的假设.定理说明每个复对称矩阵"了合对角化，但是没有直接得出这 
时合对角化町轻两变換来实现这个事实.参看本节末习题2 2 . 

关于合相似和合对角化的这些论断冇助于深人埋解关于复对称矩阵的 Tahsi 分解 （4.4. .1) 
和关于经忾相合一_角化的定理( 4 ‘ 4 . 3 ).定理 C 4 U ) 说明每个使/有全部作负特征值的矩阵 
AeM » nj ■酉 合三 角化，而 Takagi 的结果说明每个复对称矩阵可以丙合对角化. 

因为对于合特征值. K 別“实”和“非丈’’没有什么 用处. 所以在类似于 Hennite (或正定）矩 
阵的“ 具 ft 实(或 IE ) 合特征值的可内合对角化” 4类似丁.正规矩阵的‘‘具有复的合特征值 的可内 
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合对角化”之间就没有什么差別. W 此，复对称矩阵可以看作与整个正规矩阵类（关于普通的相 
似)类似的矩阵类（关于合相似 K 而 TakfLgi 分解可以看成与 ] F _ 规矩阵的谱定理 （2. 5. 4 a , b ) 类 
似的结果. 

普通的相似性理论的产生是由于研究不同基下的线性变换的结果.一般说来，合相似的产 
生是由于研究不同基 K 的反线性变换的结果.反线性变换 r 是从一个复向量空间到另一个复 
向竜空间的映射7' : V - W , n 有可加性 [ r(.r 1_3<)--7^十对所有 1 ， 成立],不 H 只 
H 有共轭齐次性对所有和所冇成立，有时称之为反齐次性].在量 
f 力卞中，研究时间反转时耍出现这样的变换. 

合对角化矩阵类是一个广泛的矩阵类.它包括 ft 有实特征值的所有实可对角化矩阵，所冇 
(实或复)对称矩阵，以及所有形如 Jf 5 s 的矩阵，其中， H 是 Hennite 矩阵，而5是对称矩阵 
(见本疔末习题8和 9). 后一个论断为 F 述有用的充分条件中的第二个奠定了基础.正定矩阵 
是指对所有非零 . rec " 有 1 二心> 0 的非奇异 Hermhe 矩阵；关于一个 Hermite 矩阵 .4 
是 正定的 等价条件是， A 的所有特征值都是正，或对于某个非竒异 Hermits 矩阵 H ， 有 A 二 
(见第7章). 

4.6. 12 推论设 A , 氐 A 是正定的 Hermiu ‘矩阵. 

( fO 如果 B 是 Hermite 矩阵，则存在非舒异矩阵 S 6 M „, 使得 SAS ‘一 /，且 SBS ‘是实对 
角矩阵. 

( M 如果 B 是刘称矩阵.则存在非奇#矩阵使得 S / US ' 二〗， & SBS 7 " 是具有非 
负主对角元的实对角矩阵. 

证明： tS ：A = H \ 其中 HeM „ 是非奇岸 Ht . rrmte 矩阵. 

( a ) C-^A ' B-H ~ B , 所以「相似丁 HCH 1 - H ( II ' B)H 1 - H 1 BH ' ,这是 

Hermitf ‘矩阵，因而 A 有实特征值且可对 角化； 矩阵 (； 也一定可对角化， li 具有实特征值.因 
此 A 和 B 可以通过 U . S . 1 U T ( h )(2) 的相合同时对角化.如果 H l BH 其中 [/ 是酉 

妍阵且 A 是对角矩阵，则非钎异矩阵 s=〖_rn %使 . SAS -— UiS 批 >=九 

( b ) OA J ii-H L ' B , 所以 〔 r=H ? ii // 1 相似于 

H ( CC)H ' - H l BH S RH 1 - (H ' FSM ')(H 1 HH ')•, 

它是 Hernnite 矩阵‘ 乂是半正定 矩阵. 因而它可对角化片具有非负特征值.根据 (0.4. M ), 
rank ( CC ) --= r = ink ( H 1 : ) ( H ~' BH ])* = rank(H ' BU 

冉根据 （0.4. 6 b ), rank (H 1 ) = rank(W ' B)--rank C . 丙此，由 （4. 6. 11) 知， （4.5.15) 

的条件 ni ( b )( n 被满足，因而…定有非奇沣矩阵 seM „. 使得 SAS ’ 和別5 7 都是对角矩阵. 
注意到 HC:(H 'BCH 是对称矩阵，闲此根据 （4.4.4)， 存在 

西矩阵 f / 和廿奇异对角矩阵： S ， 使得 H s B(Ff ! V = L ^ [厂或 ( t /* // '} B ( U * H 『） 7 =2 .如 
果令 则还有 n 

我们已经讨论「各相似十一个对角矩阵的问题，但是不是每个矩阵都可合对角化.因而自 
然要问，在合相似下任…矩阵是否可以化简成某种简单的形式.在合相似下，有一个标准形， 
它起 的作用 类似于 jotxlan 标准形在普通相似性中的作用.利用它，可以证明，对每个 .4( 
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A 合相似于 A , A •和 A T [弓 （3. 2. 3) 比较],■4合相似于出17^6矩阵[与（4.4.9)比较]， A 合 
相似于实矩阵，并且存在非奇异对称矩阵 S lf S 2 6 M „ 和 Hmnite 矩阵仏， K & M ,, 便得 A = 
与推论 U .4. U ) 比较: 1. 实际上，吋以把整个含相似性的问题归并为一些更熟悉 
的概念：两个矩阵 A , B 6 M ,, 合相似的必要充分条件是 U ) AA 相似于 BB , 且 （ b)nmkA = 
rank / i , rank AA - rank BB . rank AAA = rank BBB, …等对所有 《 个这样的交错乘积均成 
立，其中乘枳的项数最多个. 

习理 


1. 证明合相似性是 M„ L 的等价关系. 

2. 给出定理 （4. 6. 3) 的证明细节. 

3. 设 zen , 是一个给定的矩阵，且 a a 是 a 的合特征值.证明 a 的相应于; I 的合特征向置的 
集合不一定是 C 丄（："的子空间，但它总是 R 上的子空间.试与 A 的普通特征向 tt 的情形相比较. 

4 . 定理 (4. S . 11) 给出/一个矩阵可合对角化的必要充分条件，但是，当我们考虑多个矩 

阵时，它们可同时合对角化的条件是什么？设 {An As . …， A t } C ： M „ 是给定的，并 a 假定存 
在一个非奇异矩阵 . seM , 使得对卜1，…， a 有九 ^ SAj — a 每个/!,是对角矩阵.证明， 
( fO 每个 A 町合对 角化； （ b ) 每个 A , 可对角化；乘积族 : 是可交 

换的； （ d ) 对于所有“ ) = 1, k , A,A , 斗只有实特征值而 — 只有 虚特征 
值‘当 （=1 时，这指的是什么？事实上.这些必要条件也是充分 条件； 災于其证明可参看 
U . 5) 节末的“迸一步阅读”中引用的 Hong 和 H 0rn 的文章. 

5. 矩阵 AA 在合相似性理论起着重要的作用.证明，对任一 aeM ,,， AS 的特征多项式 
的系数都是实的.由此 推出， AA 的任何复特征值必须成共轭对出现. 提示： det ( M -. MA ) 
-dct A det (；/- AA ) - det (/I - ,4 A ) det A . 因此， 如果 A 是非奇异矩阵，则 AA 和 AA 二 
( A _ A ) 的特征多项式扣间.对一般情形则考察 A e = A + s /. 关于 AA 的更为明确的结果虬>」 题& 

6. AA 的非负特征值可 $ 出 A 的合特征值.但是. .4.4 的不是非负的任一特征值也有意 

义.假定 R AJ : = Aj : 对某个和某个适合;|$[0’ oo ) 的;成立.段 atC ： 是 A 
的任一平方根，[|用八7=灯定义向 tf >证明， = /\ A . y = A ^, 及上与）无关.提示： 

如果它们相关， . r 必须是合特征向量且 A >0. 证明 AA 的所有复特征值必须成共轭对出现，且 
AA 的任一负特征值至少必须有几何重数 2. 试与习题5比较. 

7. 设 A & M „， 且假定 A 是的一个实负特征值， AA ^ = A . i -. i 关0, /= A , AS = av . 

二 a - T . 根据习题 ( S , JT 和, y 是无关的. U ) 设 .〆 =』. +办 ， y = j — 在证明，对于 pec 的任 

选 择，且 A /' H 7 . ( b ) 证明可选择 J 3 使 〆 与 y 正交’并且选这样一个尽 < c ) 设 
S >0 使是单位向置，乂设 7= , y . 证明， A — 卜 arj , Ai = a f 和 f ' ?=(). (心设 r >0 使 q 
是单位向量，又设 U =[ 7 r 7 叫… Ue ]6 M , 是两矩阵.证明 
|" 0 ra . * 1 

U ' AU = ( a/r 0 i I ， 其中 A ' e AC ” 

I Q : ^ I 

因而 _ 
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r a o * " 

W (AA )1.7 - j 0 A : . 

r " 0 UVt ’ 

< e ) 由此得出， AA 的每个负特征悄有偶代数韋数.试与习题 (3 比较. 

8. 对代意 A & M ,,， 证明 

—j A ]w T A l -^-- -°1. 

-o ; 」LA 0」 l _0 了」 一 A AA 」 

从这个明 W . 的相似性推出， AS 和 7 L 4 的有非零特征值的 Jordan 块之间存在一一对应.因为 
kkH 证明 AA 的具有复特征值的 Jordan 块成共轭对出现.由此推出，对任一 A G 屹， 
AA 相似 f - 实矩阵.提示：参看(3.4)屮关于实_10 1 ^1 11 形的讨论.还有-邱结论实际上是成立 
的.事实上. A 4 总相似 T -- 个实矩阵的平_；厂就 AA 的特征值而言，这意味着什么？ 

9. 如果相似于实矩阵.证明 A 相似十:4(反之亦然）.利用这个丰1:和习题9证 
明，尽管—般不一定相似于 BA , m 是，对任意 AeM „, AA 总相似丁 - AA . 

10 . 说明 M ,, 中可合对角化矩阵的集合包括以下 集合： U ) 只有实特征值的所有可对角化实 
矩阵. （ b ) 具有个线性无乂的实特征向量的所有可对角化矩阵. （ C ) 所有对称矩阵. （ d ) 所有 
正定 Hermhe 矩阵.提示：如果 A 是 IH 定矩阵，则 A = HH = H ( HH T ) FJ 1 : H 是非奇异 
Hermite 矩阵. （ e ) 所冇形如 .4 B 的矩阵，其中， A 是] T . 定 Hermite 矩阵， |〖 U ' S 是对称矩阵. 
这与所有形如 H 2 B 的矩阵的集合相同，其中， H 是非奇异 Hermite 矩阵， B 是对称矩阵 .埔 
示： 

11. 证明 M „ 中可合对角化矩阵的集合（: D „ 有下述性质： （ a ) 如果 A 6 C 7 X , RS&MJfi 
奇异，则 iSAS 1 ero „. a ) 零矩阵在 ox 中.（<，）如果 a & c : d „ 且^^<:，则 Mecu . ( d ) 
如果 A & rD ,, 可逆，则 A ' ecD „. 

12. 证明， ( a ) i ^ □ 在普通意义下不能对角化，似它可合对角化. （ b)D — U 在普通意 

义下可对角化.但不能合对角化. （ c )= 既不能对角化也不能合对角化. 

13. 如果使得 A；\=A 二； U,,© …任认匕. K 中，如果 Z 关_/，则；且所有 A,5sf), 
证明，存在 H 矩阵 U6M,,. 使得 A 二 LM ； 7 . 且 办 ㊉…㊉其中每个厶6灿„是上三角矩阵. 

14. 引理 U . fi .9) 是说，对某个非奇异矩阵 S 6 M ,， A 6 M „ 有分解 AsSS — S 当且仅当 
AA = I . 试用 （4. 4.4) 证明， Ast / U — 1 二 L / U r 对某个丙矩阵 UeM , 成立，当且仅当 A =A 
iL .4 是对称矩阵.这与 (4. 4. 7) 有什么关系 

15. 设 A 6 M ,., 其中 B , CeM „( R ). 证明，是4的合特征向量， 

当且仅当± I A | 是分块矩阵 


TB C 1 

—b 」 … R ) 

的（实）特征值. 提示： 用 t = u 十川表示力 I = n，v^R", r- I A | . 因而，如果 F 没有 
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劣特征值，则 A 不 "了能 有合特征值. 


16. 证明，如是对角矩阵或上角矩阵，则/\的特征值与 A 的合特征值在下述 
意义下是 1 ‘相同 ”的： 如果 A 是 A 的特征值，则对所有 $ e ： R . / A 进 A 的合特征偵，乂如果 " 
是 A 的合特征值■则 对某个 ee R , 是 A 的特征 m . 

17. 如果 A6M„(R)， 址明. A 的每个劣特征值也是 A 的合特征值.又如果是 A 的 
合特征值， 则" 成-"是 A 的特征值.提示；用，=« t h 表示 AT 二⑷..„， t ，eR °. 考察例 



以说 明， 


■个实矩阵可以有这样的普实特征消，它不5任何合特征值相对应. 


1 K . #«二1[1彳引理（4-6.9)是什么意思_> 一个复数 s 位干复平面中的单位_上是指 2 2 = 
1 . 这个条件到矩阵的普逋推广是要求 AA * — h 这样的矩阵称为酉矩阵，它们在矩阵理论中 
起养®要的作用.另一个推广（当时它简化成同样的情形）是要求 AA = /， 而这些矩阵如 
引埋 (4. S . 9) 所描述的那样合相似于单位矩阵.证明，若 = 则 （!1)/ \是非奇异 
矩阵； OO.A '- A ； ( r ) det A : - U ". A „ | =1; ( d ) 若 Ar — A.r li ，关0， 则 A ; = ( l / A ). r : 
因 Ifli . 只要 A 是 .4 的特征 1/ A 就是 A 的特征值. 证明. 若 2 弇上 1. 则姖阵 B = 

L ^. y 有如下件 A —;;"- 1 的谱是 


_ 


國 



因此，这样一些矩阵的特征值不都位于单位圆上. 

19 - 争实匕每个•复矩阵可以写成為=只片，其中 . i ?, K 相似下实矩阵， 

而 it ：—/. 说明这个分解是如何从每个 AC _ M „ 相似丁•实矩阵的事实得来的.并且解释它起怎 
样推广 r 每个复数 ，可以 写成.其巾「和6是实数)这个事实. 

20. 证 明定理 U .6. ^町以由木节正文最后一段中所述的两个矩阵合相似的般必要充分 
条件推出. 提示： 把条件应闬 T A 和对角矩阵 A . 

21. 利用每个 A(zM„ 合相似于一个劣矩阵的事实证明，如果是奇数，则 A 至少必须有 
•个 合特征值.提示：奇数阶实矩阵 K 至少有 .个 实特征值. 义丁- 圮的特征值’这意味着什 

么？如果 A 合相似于 _ R ， A ,4 与有何关系？ 

22. 设 A 6 M „ 是对称矩阵.定理（彳.6.1 ] )后面的讨讼说明4可对角化，所以’疗在非奇 
异矩阵 S 6 M „ 和对角矩阵 yi e M „. 使得 _4 = SA ^ — ] . 说明，我们可以取 S 为酉矩阵[内而从定 
理( 4 ‘6. ]1)可导出推论 （4. 4 .4)」，如下所述：注意到 A 的对称性推出 

y 1( S ‘ S ) t . 利用极分解 （7. 3. 3)把3写成‘5二〖仆，其中， U € Ai 是两矩阵 ， P & M ,, 是 
Hermite 矩阵，目.对干某个多项式 〆 n 〆 S * S ) [见定理 （7. 2. 6) 的证明].证明 = 
AP T , 因而沿左 

^ 进一 步阅读关于合相似以及一个矩 阵族同 时合对角化的问题的更多信息，可参看 （4. 4) 
节和（ 4 . 5 > 节末所引用的 Hong 和 Horn 的文章，也可参苕他们的报 ft ■: “A Omonica ] Form for 
Matriros under Consimilarity ", Uneur Mgebra Appl' 102(1988), 143-168. 合相似的槪念 
4 作如 F 推广：用仟意域代替复数域且用该域上的自同构代替复具轭运算 t 见 fj ac ], p ,27. 





第 5 章向量范数和矩阵范数 


5.0 导引 

考虑 c » 中的若十个向量或者中的若 T 个 矩阵，说有些向量或矩阵“小”，而说另一些 
向呈或矩阵“大”，这是什么意思？在 彳1 么情况下可以说两个向 M “很接近”或者“离得很远”？ 

在一-维及5维实向量空间中.“大 小”问 题与“接近”问题通常涉及到 Eudicl 距离.向量 
26 R "的 K „ rli <] K 度是 — 2 . 按该度量标准如果这个非负实数较小，就说 z 
是“小叫 M ”. 此外.说向置.『和>『离得“很近”，是指差的 Eudid 长度是一个很 
小的非 负丈数. 

矩阵可以看成高维空间 t 的向 M ， 那么矩阵的“大小”指的是什么？关于无限维空间中的向 
M 的“ 大小” 指的是什么？义于复向 tt 呢？除了用 RiicHd 长度以外，还有没有度量实向量“大 
小”的其他有效方法？ 

要回答这些问题.一个办法是研究矩阵与向量的范教或大小的度量.范数可以看作 Euclid 
K ： 度的推广.当然，研究范数并不仅仅是为/作一下数学推广而已.为了恰当地表达象 矩阵幕 
级数这样衅概念，范数是必不可少的，并目_在分析和评价关于数值计算的各种算法中，它也 
是必需的.此外，已被采用的各种不同的范数大体上可适用于各种场合，所以，研究所有范数 
所共有的一些件质，而不是把注意力集中到任何个别的范数上，这样做是可取的. 

F 述各例从几个方 ii 说明引进范数的必要性. 

5.0.1 例（收敛性）如果 . r 是 复数， 且丨 .H <1，我们知道， 

(1-x) 1 - l + .r + r : I t- 

它给川计算方阵 1 - A 的逆的公式 

(I-A) 1 - .A | .A ; + ■■.， 

然而.什么时候这个公才能成立呢？可以证明，这只要矩阵 a 的范数小 t - i 就行 r , 并且 
这对于仟何范数也是如此！同样，利用范数町以证明，汗多其他可以用来定义一个矩阵的矩阵 
值函数的幂级数是收敛的，因 Ifu 其定义是有意义的.例如， 

就是这样.为/按所要求的精确度汁算一个特殊的函数值，范数也可以用来确定幂级数中所需 
要的项数， X 于分析解方程组的迭代法的收敛性问题，也可以作类似的论述. 

5-0.2 例（精确性）设/是一个实变量的实值可微函数.我们知道，如果已知 
的值.则/在其附近的值可以用一阶导数 

/(-.v+^-ZO^ = 4 /^， 
k Ajc 

来估计.因此，在计算/与^的值时，如果实际上算出/在附近』=〜十/ 1 的值，那么，就有 
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一种估计相对误差的方法. 

关于矩阵计算也会出现同样的问题.假定想计算 A 1 (或 A 的其他函数），伹是 A 的各元 
是通过实验.通过其他数据的分析、或者 M 从先验的 i 十算得来的.并认不确切地知道这些数. 
这时可以把 A 看成一个“真”的 A ,, 再加上一个误差 E ， 并且在计算 A -' = U , + E ) 1 而 不是汁 
[ PH 算 A „ 1 时.我们想（用 E 的“大小”）估计可能的“相对误差”.知道 A 1 与 .4 1 之 N 的相差程度 
与知道的精确值可能是间样 fi 要的，时范数为处理这类问题提供了一个系统的方法. 

5.0.3 例 （界）对干与矩阵相关联的一些重要的 tt (例如特征值)的界常常要涉及范数.当矩阵 
产生扰动时，这些量的可能变化范围也要涉及范数. 

5.1 向置范数和内积的定义性质 

我们先考虑向量空间上的范数‘由 TM ,, 是向 M 空间，要做的一切也将适用于矩阵范数. 

—个函数如果是范数，它需要具备哪些性质.为了说明这个 M 题，对熟知的（实或复）纯 M 
的绝对值概念进行抽象.当然，一个值得注意的差别是.绝对值函数是实变量或复变屋:的实值 
函数，而我们要求范数是描述一个向量的多元实值函数. C ' 上的这样一个函数是 Eudid 长度 
但是还有另一些函数也具有 Euclid 长度的某些基本性质，并且在某些场合可能是更 
为合适的度董，它们可能提供另外的信息，或者在某些内容中使用起来可能更为方便. 

在整个这一章中，只考虑实或复向量空间.所有的主要结果对这两个域都成立，不过在每 
一个结果中，它必须与所采用的那个域相一致.我们常用域 F ( —开始就视 F = R 或 C ) 叙述各 
个结果，之后，在余下的论述屮涉及的是同一个域 F . 

5.1.1 定义设 V 是域 F ( R 或 C )」: 的向量空间 . 函数 IN : V ^ R 称为向 量范数 ，是指对所 


有 . r , jev 有以 F 性质_- 

(1) |} x || >0, 非 负性； 

( la > || .HI =0当且仅当0, 正 定性； 

(2) [| = i H || ,r [| 对所舍纯 M rf F 成立， 齐次性； 

⑶ lU + yll ^ ll^H + lly ； l ， 角不等式. 


这四条公理是大家所熟悉的平面上的 Euclid K 度的几个性®. Eudid 长度还具有另外一些性 
质，这些性质与这四条公理是独立无关的[例如，平行四边形恒等式 （5. 1.8)]，因为它们对于 
一般的理论并不是必不可 少的. 所以没冇把它作为公理. 

_ 一个函数如果满足公理 （1), (2)，（ 3 )但不一定满足 （ la )， 就称之为向量半范数.半范数 

在允许某些非零向童有零长度方面推广了范数概念. 

S . 1.2 引理如果 | i _ || 是 V 上的向量半范数，则 

I Ml — lb " |< ik -， || 

对所有 j -，. vGV 成立. 

证明： 因为 j = j '十 (j —_ r ), 由三角不等式和齐次性公理 (2), 有 

II 3 " II < II J- |i + II — J- II = I! J- II -f || j" — 31 || . 
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由此可知 

'I >' j| - |1 J i| < II -r - y il . 

乂 W 为 i = j+(.r —>0, 所以再由”角不等式有 

U!l < Lvll + I'vll ， * 

W 而 

II J " II - II 7 II < II J ' ■- >' II - 

闲此我们证明了士 （ UII - iLvIl XII 1—3^11，它等价于引理的论断. 口 

与 C " 上 Eudid 长度相关的概念是通常的 Euclid 内积(有时叫做“点积”），它有一些性 
质与两个向量间的“夹角” 有关： 如果 _ vV =0. 那么： r 与^正交.正象对向量范数所做的那样， 
可以抽象出 Eudid 内积的几个本质特征，并且用它们作为一般内积理论的公理. 

S -1.3 定义设 V 是域 F ( R 或 C ) 上的向量空间，函数卜， . >: VXV — F 是一个内积，是指 
对所有 x ， y ， V ，有 

(1) 〈 X , » 

( la ) ( j -, ^)=0 当且仅当 x = 0 T 

f 2) 之>= (/, z >+ { y ， 

(3) uu -, = 30 对所有纯量 t ‘ eF 成立， 

C 4) < j , y >= ( y - t )， 

练习证明 EiKlkl 内积 30 =，^满足关于内积的所有上述四个公理. 

练习 设 D = tliag(d A ， …. 式,）*考虑函数 ( X , y )= y ' Dj , { - , > 满足.关于内积的 

哪几条公理？ D 在什么条件下 <* ， ■ >才是内积？ 

练习由定义 (5. 1. 3) 的四条公理推导内积的下述性质： 

(只 ) (-T ? cy ') ~c (•』， y ) ; 

Cb ) y + z >=〈.. j :， 之>; 

fc ) { a . f+*>'i ftr +(/ s)=ar ( jr , - w}+bc ； v , ixO + Jc / < j ~, z)+bd ( y , z > ； 

<d) (.r, _ y >=0 对所有 ytV 成立，当且仅当 . r = 0; 

(e ) (s, (j-, y)y)= \ (.r, _ y ) | 2 . 

所有内积都共有的重要性质是 Cauchy - Schwarz 不等式， 


非负性 

正定性 

可加性 

齐次性 


S . 1‘ 4 定理 （ Cauchy - Schwari ： 不 等式） 如果 （. ， .） 是域 F(R 或 C } 上的向童空间 V 上的内 
积，则 

[(• r ，_ v > 卩 < < x , x ) < y , y ) 

对所有■>：， _y6F 成立. 等式成立缉且仅当 _r 线性相关，即对某有 ,ru 或 
证明：没^，是给定的.如果 _ v = 0, 则结论显然成立，所以可以假定 ）/0. 设 
R， 考虑/>⑴三 （J'+t.y， I十 fjO = Cr, r ') + t (. y , x ) + l ( jr , y )+ r < y , y ) = ( x , +2(Re(^, 

p + 3 1 〉， 它是实系数二次多项式.由公理 (5. 1.3(1)) 得知，对所有实数因 

而/ >u) 不能有实的单根.因此， />(?) 的判别式一定是非正的，即 

(2Re 〈 j ， y〉） 2 —4 〈 y ， y) 〈 jr ， jr> ^ 0, 
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因而 


( Re(.r )' ( jsy ). (5. 1.5) 

因为这个不等式对仟一对向董都成立.所以当用 <_ r , . vh 代替 J 时它也一定成立.于是还有不 
等式 _ 

( Re 〈 jr ，（ j ， y ) y 〉） : j : y ) \ i . r , y } |'. 

但是， ReC . r , (. r , y ) y ) - Rc ( x , .y >(./■. y)=Re | <. i ', y > [*= | : j , y '> |-, 因此 

丨 ( i ， y ) I 1 ^ ( j -, x > ( y > y ) ' (. r .^- y ) | 2 . (5. 1.6) 

_ 如果 (.o y ) = 0, 则定理的结论是显 然的； 否则可以用数！ M 除 (5.]. S ) 两边得到所要 

证的不等式.因为公理 Cla ), 所以仅当 J ' H. v = 0 对某个 Z 成立时/ !( f ) 才有一个实（二重）根. 
因此，在判别条件 （ S . 1.5) 中等式能够成立，当且仅当 x 和 y 线性相关. □ 


5.1.7 推论 如果 < ■ ， O 是V上的向量内积，则 |U|| 二 （U, Z) 1 ' 2 是1上的向量范数. 

练习证明 （5. 1.7). 提示：只有角不等式的骑证不明显. i| 算.| t 十 J ||%然后利用 
Cauchy-Schwarz 不等式. 

如果卜 II 是适合 I .HI = U , W 1 - 2 的向量范数.其中< . ， .> 为某个内积，就称该向量范 
数可由 I *!积（即〈‘， •；>) 诱导. 

习题 

1. 设*■，表+ 中的第 ； 个单位坐标向 M 且假定：| _ || 是 C" 上的一个向 W 半范数，证明 

IU II < i ； U . IIU , | . 

<= ] 

2. 如果II‘II是V上的一个向量半范数， 证明 K = IUII 二 0) ■是V的一个子空间 

(称为叉于 HI 的零空间：). U) 如果％是V的适合％。％ =彳0}的任.-子空间，证明I卜II是 
V,的-个向量范数. （h) 考虑用 

JT〜_ V 当 j〗. 仅肖 || .r —3- I, =0 

定义的关系证明，〜是 V上的一个等价关系，而这个等价又系的诸陪集具有形 — 
{J-+.V6V ： J-6K}, 并 H. 这些陪集的集合以一种自然的方式构成.个向最空间. 证明 ，闲数 
II -HI lUli :是冇意义的，并 R 是唐陪集组成的向量空问上的-个向童范数. （ c) 说 
明芍每个向量半范数有关的自然范数为什么存在. UD || I: ^0是半范数吗？ （e) 给出一个不 
是范数的非平凡半范数的例子. 

3. 证明，如果定义两个非零向量间的夹角是介于0弓 W2 之间的值 

cos ' { — 1 仏… 」_ \ 

I v , v )) 1 ' 2 / ' 

[262] 则这个夹角概念对任何内积都是有意义的. 

4. 证明，如 （5. 1.7) 中由内积诱导的向量范数一走满足平行四边形恒等式 

-|-C II .r+ || : + j[ X - f) = 1 MM II .>■ II 2 . ( 5 - 1 - 8 ) 

为什么这个恆等式得此名称？事实上，等式 （5.1.S) 是一个给定的范数可由内积诱导的必要充 
分条件.见习题 10. 
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5. 考虑定义在 C t 的硪数II r II, ^m a x lw ,,.„ U, I . 证明 IMU 是不能由任何内积导出的 
向 M 范数. 

6. 如果II .11 是由内积卜， * >诱导的向 li 范数 . 证明 

Re < J -,. y > - j ( i | j-+ v || ? - (5.1.9) 

称这个等式为 极化恆 等式，同时证明 

Re ； j -,>'> ^ ~( || ./■ - f.v || 2 II x It 2 || .y | I K ). 

1. 证明， C ’' 上的6范数 ||二！ a i + … + I 适合公理 (5. 1.1), 但不适合极化等 
恒式(5.】. 9). 因此，它不是由仟何内积导出的. 

8. 如果 HI 是由一个内积诱导的V上的向讀范数，则 

1十>_|| ik v I < |! .. ip + -i .v r 

对所冇 h .yG V 成立.什么时候等式成立？这个不等式对所有向量范数都成立吗？给出这个 
不等式的几何解释. 

9. 设/和 .V 是 V 中给定的向 M , V 有一个由内积 （. ， . > 诱导的范数 HI , 并且假 

定3 ■是非 零的.证明，使 IU — 町 || 的值达到极小的纯量 3-)/ II 3- II 2 ■ 并且 
J V 正交. 

10. 不难证明（但也有一些技巧），平■行四边形恒等式 （5. 1.8) 是一个给定的范数可由内积 
诱导的充分条件.首先考虑 R 上的…个向董空 N. 设 IH 是V t.- •个 给定的范数. （a) 定义 

(一』麗 卜 IMIW . (5 .1.,0) 

证明.用这种方法定义的（‘， •） 满足 （5. 1.3) 中的公理 （1), (la) 和 （4), 目_(1,= 

I 1 -r il ；， . (b) 利用 （ii. 1.8) 证明 

4{^, y )+4C^.v>=2rr + > .|P +2|U t 7 H' J 2 |M| 2 — 2 iU IP — 4 || y 『 

— II j ： f « || - — || j + e tl : — 4 II y II 2 = 4 <j - 十 z , y ) , 

由此得出，它也满足 (5. 1.3) 中的可加性公理 (2). (c) 利用可加性公理证明 f Jl > = n(x, ^v) 

且川 ( m 丨似. y ) = [ nx , y ) = nU , y ), 其中 m 和”是非负整数.利用 (5.〗. 8) 以及 （5. 1. 10) 证明[||3] 
(―丄， >')- 7 > - 由此得出〈似. y > = u(L y ), 其中是有理数. （ d > 设 〆 £) = f 2 |U p 

.>0十||)|| 2 , fFR , 然后证明，若 r 为有理数，则 〆 f )= || " + )]| 2 .由 〆 f ) 的连续性 
推出 * 別所有 fGR ， p ( t )^ Q . 根据的判別式-定是非正的事隻:推出 Cauchy - Schwarz 不 
等式 | W | z < | M | 2 |_ vf . ( e ) 现在设是给定的，证明 
1 , v > — I - I {(a — b ) j -. y } + (6 — a ) (. r ，3<) 

< I da — b)s,y) I + | (6 — a){./-, j') I < 2 | a — ^ | |; _!■ I| || v || 

对仟何有理数 b 蚊， 并 11 .可以使上界任意地小.由此得出 （ 5. 1. 10 ) 满足 （ 5. 1. :i) 中的齐次性 
公理（幻.这就证明了 {. ， . ）是1 上的一个内积. 

细心的读者会注意到，在上述论证中关于范数 H 的三角不等式 [(5. 1.1) 中的公理 (3)] 没 
有用到.因此， （S. 1. 1) 中的公理（1 〕 ， ClfO 和 （2) 连同（ 5 . 1. 8) 蕴涵以下事实：函数 ||*|j 是由内 
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积诱导的，因而它是-个范数，并且一定满足三角不等式. （ f ) 若 V 是一个复向量空间，定义 

u ， y> — II ii z - I ^ n : - n .y n 2 , i( ii r+b 卜 ii 工 ii 2 - ii .v in . 

U ， 4的实部是 V 看作 R 上一个 向童空 间时的内积.利用这一事实和 (5.1.8) 证明 <•. ，>是7看 
作 C 上一个向量空阆时的内积. 

进一 步阅读 平行四边形恒等式是-个给定的范数可由内积诱导的必要充分条件，这个结 
果的最早证明似乎应该属于 P . Jordan 和 J . Von Neumann , 他们的文章是 “On Inner Products 
in Linear Metric Spaces ,’’ Ann . Math. 36(2)(1935), 719-723. 习题] 0 中所给出的这个结果 
的证明参考 f 下述文章： D . Fearnley-Sander and J . S . V . Symons , * l Apollonius and Jnner 
Products ," Amur . Math. Monlhly 81(1974 ), 990-993. 

5.2 向 置范数 的例子 


下面所列举的是一些常见的向量范数的例子. 


5.2.1 C 上的 Euclid 范數 （或卜 范数）是 

II 4 = (la 、 l :, + ...+U, I 2 ) 1 .' 

这也许是大家最熟悉的向量范数，这是因为 IU — A 能度量两点 - r , KC " 之间的标准 Euclid 
_ 距离.这个范数还是由普通的 Eudid 内积导 出的 ； II x || — , r ) 

练习 验证 lh -|| z 是 C " 上的向 M 范数. 

练习 范数 II ， II 称为酉不变的，是指 II Ur II = 11 _ r !| 对所有 _ i . ec 1 和所有酉矩阵 
成立. 证明 Eudid 范数|卜||是酉不变的. 

s . 2.2 CT 上的和范教（或 a 范数）是 

II : 11! ^! j'i .+ …十 I | . 

M 为其 K 度只是沿各坐标方向的直线度量，这个范数也称为1 一 范数或更风趣地称为 
Manhattan 范教， 

练习 验证和范数是 C " 上的向量范数，但不是由内积导出的. 提示： 利用 (5. 1.8). 

5.2.3 C " 上的极大范数(或 L . 范数)是 

II J - L = max { | Jr ! I I }. 

练习 证明 IH 。. 是 C " 上的向 M 范数. 

练习 M * IU 是由内积导出的吗？ 

5.2.4 C 上的~范数是 

I ； ^ ||, ^ ( 2 | x , \ f ) h \p^l. 

线习验证.对于户>〗，每个~范数是亡上的向 M 范数，且对于每个』 fc ', !| ^ ||„. - 
li ' T t - 提示： 只有 = 角不等式是较难验证的公理.关于~范数的7角不等式是称之为 
Minkowski 不等式的经典不等式. 
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练习给出-个不是 G 范数的向擞范数的例子. 

上述各个向量范数的例子都是 C" 上的范数，不过还能用它们来构造任意有限维实或复向 
量空间V 上的向量范数，如果…， //" W 是V的基，则 


[ V ], 


L “ 


e c™. 




是 v 到 C" 上的同构.如果 1 IH 是 c" 上的仟-向量范数，则不难证明 


[26^ 


il x|| f = ||[ a - U ； = li [_ r ]. …，上„7 || , x = 

是 V 上的向世范数. 1 

练习验讪最后一个结论. 

称矩阵 B 6 M „ 是关于 C " 上的向量范教 H ! 的一个等距变换，是指 

II Rj ' I . = IU il 

对所有成立. 

练习证明.关于任何向量范数的等距变换一定是非奇异矩阵. 

练习证明，关 T •给定的向量范数的各个变换等距所组成的矩阵集合构成一个群（称为该 
范数的等距变换群).除了两矩阵以外，对 | i .|| 2 , 还存在任何等距变换吗？ 

练习证明，和范数的等距变换群是所有那样一些矩阵组成的集合(群），这些矩阵看上去 
像置换矩阵，只是其屮的元素 “ + r 用绝刈值为1的任意复数來代替. 

练习极大范数的等距变换群是什么？ 

向量范数的定义并未要求向量空 M v 是有限维的.例如，空间 v 可能是实匿间 [ u , 6] 上 
的所有实或复值连续函数构成的向量空间 r [〃， 幻. ■ 


S .2.5 例 ck, 幻上的某些范数例子类似丁 +已经对 c" 定义的诸范数.例如， 


II / li 2 ^ 

‘ 

u 范数； 


![ / (1, 三 

=J 丨 / ⑴！ df. 

L 范数； 

_ 

1! 1'\\, = [£ \ JU) IM?] 1 p>l, 

l ? 范数； 


!l fl ^ 

=[ /( J .” a 6 ， 

范数； 



它们都是〔1 a, 幻上的 范数. 

习顆 

1. 证明，如罘则（5.2. 4) 定义 c" J. 的一个闲数， 除/ •向量范数的一条公理以 
外，这 t ■闲数满足所科的公评.它不满足哪条公理？试给一个例子. 

2. 设 n . if : 明 O I : ---lim I / 

P - ' 

3 - 艾于（'[0，1 I I :的 Hlr 其'角不等式#来与什么一样？对于(："，如何从 Minkowski 
心等式 （附珙 B ) 出发 i 证明这个二用不等式. * 
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4. 设 /h ，朽，…，久是给定的正实数，下面哪一个是 C 上的向量范数？ 

( a ) It ,r II = Y^p r \ X, \ , 

j • 1 

( b ) || i|j — (心 u O ' , 

( c ) II J - II = max {/), I I ，… ，九 I I 

5. 设 [心 ft "! 是给定的点.证明，如果《<心则 M 上的函数 ll / L „= I /(〜） I 是 
f - 范数而不是范数. 

fi . 如果||_|是 C " 〖:的西不变向 M 范数， 证明 ， H =a IH : 对某个 a >0 成立， H . IMI , 
是使 II il - i 的唯一两不变向贵范数. 

7. 证明 ，II ;y IL —max. lrl|=1 I .且 | ,r ill = niax, . , u i i .r ^ | . 

8. 试用前面的练习证明，如果 A + 在和范数的等距变换群中，则 Aft 极大范数的等距变换 
群中.反之亦然. 

9 . 所有^范数的所有等距变换群的交是彳|么9 

_ 进一步阅读 义于 Minkmvski 和 Hrtlder 的 经典+ 等式的详细讨论 n | 参看 [ BB ]. 

5.3 向量范数的代数性质 

从任意一个或几个给定的范数出发可以用多种方式来构造 些新的 范数.例如，容易证 
明，两个向量（宁_)范数的和是一个向量 （ f _) 范数，一个向 M (半）范数的任意正数倍义是一个 
(半) 范数.按男一种方式也不难证明，如果 II _ IL 和卜 II ,,是向量 范数， 则由 IM = m ax { || J ~| L , 
il -r M 定义的函数 IN 也是向量范数.这些论断都是 _ f 述结果的特殊情形. 

s .3.1 定理如果 ，…， |卜||„ || 是域[01或0上的向量空间1上的向量范数，乂设 Hi ,, 
是 IT 上的向量范数，使得对具有非负分 M 的所有 3 N 都冇 II j II # II 十 Hly 则由 

IUII = II [ IM \ ，…， IMI IU 定义的函数 11.11 : v —k 迫\，上的向童范数. 

定理中关于范数 H 卩的单调性假设可确保所构造的函数 | i . II 满足三角不等式.所冇的八范 
数都具有申.调性这 -- 性质， R ™ 上的任- 向 量范数 I , ^ M 尚若只是^■的分量的绝对值的函数，该范 
数也具冇单调性这一性质；见( 5 . 5 . 9 和 5. 5. 10). 佴是， 有一些向量范 数不貝 有这一性质. 

练习证明定理 （5. 3.1). 

练习证明两个向量范数的和或取极大仍是向量范数的事实是定理 （5. 3.1) 的特殊情形. 
关于取极小又如何？ 

练习设》!= 2 , y ~ r l， fi I ； j - ii ;i — I j-, — .j . I - i - I .j-； I . 证明， i |. i|, f 是 r 2 f .. 的向量范 
数，但函数 IU . |[ = IU _ ll j ' IU ， II -r II ] ] r lb = min ； I . r ： ； , | | } 十 | j 、| 十 | jv I 不是向 
量范数 . Il_ll 满足哪儿个向量范数公理？ 提示： 专察丨 U 十. vil , IMI 以及 
I 1 J 1 li -这勻 （5. 3. 1) 矛盾吗？ 

从旧范数构造新范数的另一种方式是由下面的结果给出的. 

5.3.2 定理如果 HI 是 C " I .-.的向 W 范数.义如果 7' e 紙是非奇 异矩阵，则由 
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II - i - II r = I 1> il , . J - f C " 

定义的 IN r 也是 cr 上的向 tt 范数. 

练习证明 （5. 3.2), _ 

练习在 (5.3.2) 中如果 r 是奇异矩阵，结果有何变化？ 

练习为什么 hll —( | 2. L - , lr 2 ! 2 _) U ' 2 l : V :: —定是上的范数.（请 不用计 算！） 

利用对偶的概 念町以 从旧范数构造新范数.这种方法作 （5. 4 ) 节末吋论. 

习頚 

1. 加果 II * II 是向量半范数.证明，对任意 T & M „, ! U || T = || 7'』_||也是扯 M 半范数.如 
果 l ‘ il 是向量范数，则 HIt 足向量半范数，它的零空间就是： r 的零空间. 

2•证明，任何向 M 半范数都具有形式 Mir 其屮，11_11是某个向量范数， iliiT ' eAi 是某 
个矩阵. 


5.4 向量范数的分析性质 


前两节中的各个例清楚地说明，冇许多各不相 N 的函数 11.11 : V—R 满足范数的各条公理. 
这样，有多种不同的范数可供选用.这是很有用的，因为对于某种应用來说，一种范数可能比另 
一种范数更方便或更合适.例如， A 范数用于优化问题往往是方便的，因为（除了原点以外)它是 
连续可微的.另一方面， A 范数 M 然只仵一个较小的集合上可微，但进它在统计学屮较为通用， 
因为它(是)导出的估计可能比经典的回归估计更有说服力 .C 范数往柱用起来是最 S 然的范数， 
因为它直接检验各个分量的收敛性，然吋，遗憾的是，不论在分析上还是在代数[._，它使用起来 
可能都不方便.在实际应用中.基 r 一种范数可以很自然地建立起一种理论，与作某种场合很容 
易计算这种范数可能不是一 M 事. 闶此， 知道两 种不同 的范数之间可能存在什么关系是 很里要 
的.幸运的是，在有限维情形，所冇范数都在某种很强的意义下桌“等价”的. 

分析中的基本概念是序列的收敛概念，冊向量范数可以用来度 a 向盪序列的收敛性. 


s .4.1 定义设 V 是 R 或 c 上的向童空间，且 IMI 是 V 上的范数，说 V 中的向 M 序列 
关于范数 IN 收敛于 a 七 V %当 K 仅当 c « 时 || ... r || —0. 

如果彳 〆 ，关 f 范数 IN 收敛于则记 

，⑴ /，或关于 i| ■ Il ^lim jL li] — 二 

应当弄清楚的是，上面提到的收敛性与哪-种范 k 有关，十是，关于一个给定的向 M 序列 
是否可能对-种范数收敛而对兄种范数则不收敛的问题提出来了.这种二牽:性在无限维空间 
中可能出现. 


[M 


5 . 4 ,2例考虑 （ :[0. 1 |(| 0, 1] 上的所有实值或 复值连 续函数组成的空间）中的函数序列 
{ f t }， 定义如 卜：对 k - Z , 3, 4, 


/ t ( x > 二0， 

/ 山 ，）= w 2 厂 n 


1 ‘ r < i ; 
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國 


f t ( x )^2(~ e ；2 . ri 2 k ' ! ). 

/'(( J ') — 0 . ■^«1. 

于是可以算出， 

当* — CO 时 ， K Ih — -0, 

对所有 k. ]| f * i ! ； - 

V_T 

当 =3 时， || /, IL = — oo . 

所以， 文于 L” lim /*=0, 但是关于其他两种范数就不为零. 

练习画出上例中所描述的各个函数的苹图，并且验证关干 L 和 I ,范数所做的论断. 
练习设 IH 是向量范数，如果 xWpT ， 且 利用- 角不等式证明1 = >因 


此.关于给定的范数，讨论一个序列的极限（如果有的话)是有意义的. 

所幸的是，例 (5. 4. 2〕中出现的现象在有 限维向量空间 的情形不可能发生.为了看出这… 
点，需要一个关于范数连续性的一般引理. 


5- 4.3 引理设 HI 是域 F(R 或 C) 上的向量空间V上的范数，乂设: r ⑴，：^…， y"」eV 是 
给定的向 M. 则用 


片 ( u ” …，: 〜） E 丨| £ “川 t w ⑶ H - hu ■⑻ II 

定义的 函数以 是一致连续的函数. 

证明： 设^= 2>，和。= fw . 经计算， 

j -1 

! gUi ，.**，《„,)—其（1 ^，… ttO | = I |i u || - || w || |! « — w [| 

=|| 2||^ 2 i — ij ' I ii ^ c ] max I … v I ， 

K - 中 II . 第一个不等式可由引理 (5. 1.2) 得到.注意，有限常数只依赖于范 
数 IH 与別个向量上 (1) ，…， /〜- 如果向鼋 V 11 都是零向量，则无需证明，否则有 C >0 .为 
了使丨片 (《 i ， …， u ,„)— t ;( v l , v ,„) I < e . 我们只需选取 I u , - v ,- I < e / C . □ 

虽然引理并未要求向量空间是有限维的，但是，向量的个数有限是很重要的. 

练习试用这个引理推出， R " 或 C 1 _ h 的每个向量范数都是一致连续函数. 

然而， V ；的有限维性质对下面的基本事实是必不可少的. 

5.4.4 定理设八和 A 是域 F ( R 或 C ) 上的有限维向; M 空 MV 上的两个实值函数，乂设 j — 
(^，，是 V 的基.假定 _ A 和/,是 

(3) 止定的：对所有 ' re - v 有 /. u ) >0， /,( j ) = () 当 n . 仅当二0; 

( I ))齐 次的： 对所有 a & F , i Q I 

( c ) 连 续的： //. Hd ) 在 r 上连续.其中 

^ ，■- -, z„y '6 F " a . J-U F ey 1 + …卜 J ,,/'. 1 . 
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则存在 有限正常数和〔',使得 
对所有成立. 

证明： 我们在 Euclid 单位球面3={&1^ : || d = iK 它是 F 中的紧集）上定义 
fA ^-( z ))/ f i tr ( z )). 由 （ a ) 可知，的分母在 S 上不为零，因而根据 ( c ) 可知 A ( z ) 在 S 上连 
续.由 Weierstraw 定理（阽附斌 E )， 连续函数； i 在紧集 S 上达到一个有限的正极大值 C M 和一 
个正极小值 C ,„, 因而 


aj'.^Cr)) </ ， C^C^>) <CV ， (x( S )) 

对所冇^65成立.由丁_^ iM ^ es 对每个非零 《 eF 成立， （ b ) 保证这两个不等式对所有非 
零 成立； 因为/, (0)=0, 所以它们对显然成立.但每个都具有形式』' = 
• rk ), 其中为某个向量，这是因为;^是基，因此要证的不等式对所有: rev 成立. □ 
定义设 V 是实或复向《空间.函数/: 如果满足定理(5. 4 .4)中的正定性，齐次性 

和连续性等-:个假设条件，则称这个函数是准范数. 

当然，一类准范数的最重要的例 f 是向量 范数； 引理 （5. 4 . 3) 说明，每个向量范数满足定 
理 (5 . 4 , 4 >的连续性假设 ( C >. 一个满足三角不等式的准范数是向置范数.由于这类范数的重要 
性，我们把这种情形 F 所得到的结果叙述成下面的推论. 


5.4.5 推论设 ll * IL 和 iH , 是有限维实或复向量空间 V 上的任意两个向量范数.则存在有限 
正常数 C ,, 和 c M 使得 （:„ liIU ；| x IL 对所有 ： e V 成立. 

练习 （5. 4. 5>为何对向量半范数不成立？ 

练习设 hTeR % E 1# 虑上的下列两种范数： IML =|| [10 x ,, ^ 2 ]ML 
和 I ; I ! [ X ” 10. r 2 ：r |L . 证明函数 /(. r ) = ( || j ||„ II ^ 圯上的准范数而不是范 

数.提示：考虑/([ I , it ), /([0, i ] o 和/([ I ， or ). 

练习如果 II . 牝 ，…，II . IL , 是 v 上的向量范数，证明，/(^) ^ < jj j | 0| 

II x || at ) 1/ * W / i ( x )= min { \\x\\ ai , IUL j 是 V 上的准范数，但不一定是向量范数. 

(5. 4 . 5) 的一个推论是，有限维复向量空间中的一个向 童序列 （关于范数）的收敛性与所采 
用的范数无关. 

S .4.6 推论如果 ||‘ IL 和 IH ,, 是有限维实或复向量空间的向量范数，乂如果 U …丨是给定的 
向量序列，则关于 | I _| L 有当 . U 仅当关于 ||. L 有 …气 r . 

卜 k N 

证明： W 为 c ,„ II x ;tl — II /⑴ 一 _r ||.,<〔'«||， ' HL 刈所冇务成立.由此可知，当 
走 — co 时， Iu ai -- J . IL — 0当且仅当 II ii s ^ o . 

5 .4, 7 定义两个范数称为是等价的，是指只要序列 彳心） 对第 -个范 数收敛于向量 _ T ， 则它对 
第二个范数收敛 十问一 向景.因此 （ S .4.6) 是说，对有限维实或复向量空间_所有范教都是等 
价的.在例 （5. 4. 2>屮已绍看到，在无限维空间中两个范数可以不等价. 

由 f R " 或 C 上的所有范数都与 | H , 等价，所以对任何向置范数有 jinn …二心当且仅 

当对所有 i =_ l , 2, ‘-+，《有 卜 
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这就是说，（关于仟一个基)依分景收敛等价于对任何向 fl 范数收敛. 

在有限维情形.关于所有向暈范数都等价的另一重要推论是，每个向量范数的单位球及单 
位球面是紧的.这个事实蕴涵仟意向景范数的单位球 I -. 的连续复值函数是有界的，并&，如果 
这个函数是实的，则它达到它的极大值和极小值. 

5.4.8 推论 设 V 是 R " 或 C ’ 1 . 设 /(•) 是 V h 的准范数.则集合 U : 和 U : /(尸= 

II 是紧的.特别是.如果 IM fi V h 的向置范数，则闭单位球 II』II <1} 及单位球面 u -: 
il II 都是 紧的. 

证明：由 （5. 4.4), 存在某个 （'>0, 使得 || KC / U ) 对所有成立，所以集合 U : 
是有界集，它包含在一个半径为 C ， 屮心在原点的普通 Euclulfel ； 中. W 为 /(.) 连续， 
所以集合与 {. r : /(. r ) 在 1} 都是闭的.由于 R " 或 C " 中的有界闭集是紧的，我们 
完成了证明. U 

我们遇到的问题常常不是判定给定的序列&⑴ } 是 S 收敛于某个给定向量 . r , 而是判別给 
定的序列是否收敛.因为这个 缘故. 需要有一个收敛忡判别准则，这个准则与序列所收 
_ 敛的极限 I 没有关系-如果存在这样-个极限 . r ， 那么，当 A、j •⑴时， 

II ⑴ —f II — lu 川 -I X .-/■» |l C II x (i> - .r II + II II 一 0. 

这是促成给出下述定义的原因. 

5.4.9 定义向置空间 V 屮的序列 U … } 是关于范数 HI 的 Cauchy 序列，指的是，对任意 E > 
0,都存在正整数 N ( e ), 只要&， k ,^ NU ). 就冇 

II 

S . 4 .10 定理设 11.11 是有限维实或复向置空问 v 上给定的范数， u …中给定的向量序 
歹 lj . 则序列收敛于 V 中的一个向 M ， 当 ft 仅当它是关于范数 HI 的 Uuchy 序列 • 

证明： 选取 V 的基 H 考虑等价的范数彳 U 丄 L ,注意到，如果假定 V = R 。 或 C "。 
为某个整数 > R 假定其范数是 II . IU , 也不会影响证 明的一 般性，如果 （/“ } 是 Cauchy 序列， 
则对每个；=1，2, …. 实数或复数的每个分量序列也是 (.: aut ； hy 序列.由于实数或复数 
的 Caurhy 序列一定有极限，因而，对每个，=1， 2 ，…，„，都存在一个纯量心，使得 li m 
— M 容秘验证 jiim ⑴二这里 j — U , …， x „] T , 另一方面，如果# 在1 使 
则 II A 1 —严 ） || < y / V—x It 十 |1 || ,因而给定的序列是 Cauchy 序列. □ 

(用于 h 述定理叱明屮的）实数域或复数域的一个基本性质是，一个序列是 c : auc h y 序列， 
当0.仅当它收敛于某个（实或复）纯量.这个性质叫做实数域和复数域的完备性.刚才证明了， 
对于任何向量范数，.完备性都可以推广到有限维实和复向 t 空间，遗憾的是’完备性对非有限 
维的向 tt 空间不一定成立. 

5.4. 11定义 ft 有范数 P.|i 的向量空閱 V 称为对范数 i |. j | 是完备的，指的是关于该范数||.|: 

迠 Cauchy 庁列的毎个序列都收敛丁 V 的一点 . 
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_ 


练习考虑具冇范数 I ； / 1| ( 
A ⑴ =0 ， 


/(D | dr 的 向呈空 并且考虑由 
丄 


仙卜 H ，- 7+7)， 
/ f ⑴=1， 



定义的函数._出各函数乃的草阐.证明，彳.八？是 Cm ^ hy 序列，但是不存在函数 / eCfO , 
]]，使得对范数; hli ， 有 jim /,: = /. 

利用 R " 或 C " 上的仟意范数或 f 范数的单位球是紧集的車实，可以引进另一种由旧范数生 
成新范数的冇效方法. 


5.4.12 定义设 /(*) 是 V . R " 或 C ' 卜.的准范数.函数 
( y ) ^ max Re y ' j ' 

/£ 11 = l "" 

称为 / 的对偶范教. 

首先说明，对偶范数是 v h 有意义的函数， 这屋 因为对丁每个固定的 
的连续函数.乂由 G .4. 8), 集合 U : /U ) = l 丨是紧®.根据 Weierstrass 定理， Re . V V 的极 
九值在某点 / U：i = l !> 达到.如果 t 是纯 量.且| ( _| =1,则由 ./ 的齐次性有 

max | v \t I — max tiitixRe t v V — max max Re vU 
J f .1 J - J " ,'(/> 1 , I " ^)，-3 . - I - 

=max max Re : y ) 二 max v \r , 

•■- 1 /(i 1 - i yv(i- I 

所以，关 t 对偶范数.冇 个有时 是简便的等价定义，那就是 

/'( v) - max i v> |. (5. 4. 12a) 

最后.必须说明，关于函数.广的对偶范教名称是名符其实的.函数 / H (.) 显然是 齐次的 
和; E 定的，囚为，如果3^40,则呵以利用 /(•) 的齐次件证明 

也许值得注意的是，即使函数 /(0 不满足三角不等式，但是它的对偶/4*)仍恒满足 
f D (y + z)。max ! 十 max [ | ; + | | J 

- ] /(j ' 1 

< max 丨. 〆 工 h max | ^ x | = 广 （ 3O 十 f D (... z.h 

n . r ) 1 =i 

因此，一个准范数的对偶范数总是范数. 

这样，采用构造其对偶范数的方法，任一准范数可生成一个范数.这种构造法常常用于准 
范数艾际上是范数的情形. " 

关于对偶范数的一个简单不等式在下面的引理中给出.我们将会看到，它是 Cauchy - 
SdiwarzF 等式的 (1 然推广. 


國 


s. 4 .n 引理设 ".） 是 v — r " 或 c " 上的准范数.则 
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I y '- i ： I s ： 

I V 彳<_ 广⑺/(.V) 

对所有 _ r , jfV 成立. 

证明： 4 U 果 i 关 0, 则 

处心) ， 

因而丨 I ‘/( d / W . 由于这个不等式对 _r = 0 也成立，所以证明了第一个不等式. W 为 
! I - i i -第一个不等式可 由第- -个不等式得到. □ 

要识別一些最常见的向 量范数 的对偶范数并不困难.如果 _ r , 则 Holder 不等式的 

特殊情形是 

I I =" I I < 1] I y^~ I < ™ax I 兄 I 2 I 七 I = II II 工 lli ‘（ 5 - 心 14 ) 

(-( ' r- I J =[ 

如果 _ v 是给定的向 M , 又如果 i 是(关于 II *11, 的）单位向 S ， 且对使 I x I = 的某个^ 
有 A = l ， 否则有 . r ,=0, 那么 （5. 4. U ) 中的等式成立 . 同理，如果 ■!' 是给定的非零向量，又 
如果7是（关于 IH ., 的）单位向量，且对所有使1尹0的；有1 = ^,/ | | ,否则有 y = o .则 

( S . 4. 4) 中的等式成立.因此， 

( I ； .V IL ) U - max | v j ,1 = max |t || , !) .r, ||, = !| v |； . , 

..“,=1 l!r ! 1 - 

( || >> j| ■■ ) n = max I _V’』' 卜 max II IL || .r ||, = i| y lli. 

|i 」 IL. = i .i j 1( -1 、 

\m 由此得出 （ liU u = H. 和 （IN ) D = IN,. 

如果考虑 Euclid 范数 li - |： 2 , 给定的非零向量 j 和任意向 fl-r, 则 Cauchy-Schwarz 不等式 
是指， 

y 1 j ' I = | S ^ vr , II ;y IL IMI ” (5. 4. 15) 

广1 

fl 当 .r — 时等式成立.运用上述关于 A 和/、范数的同样的论证，得知 <| b , || 2) 。二 
II .y :| s ，所以 Euclid 范数是它自身的对偶范数. 

练习说明为什么 （5. 4 . 13) 中的不等式是 Gauchy - Schwari ； 不等式 （5. 1.4) 的推广. 

注意，对 W ! (才讨论的 . r : 个范数(;】， ；2 和〖，）中的每一个，其对偶范数的对偶是原范数.这 
不是偶然的 巧合； 对偶性定理 (5. 5. 14) 说明，这种情形总是成立的. 

5.4.16 定理设丨1，1|是或 C " 上的向量范数， M c 是它的对偶范数，乂设 c >0 是给 
定的. 则 IUII 『对所有成立当且仅当 I 卜 II IMh . 特别是 ， H = || •『当 

且仅当卜 li 是 Euclid 范数 

证明： 如果 H = v ? IHl 2, 则对任意 xev ， 

jj j || D = max I x> J = mai i J-'y \^= max U * 

- l II ylL,-l/V7 II V ilg - 1 f Vc I 
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- i max I b I = II ?=丄 IMI S = - 1 - I: .HI . 

^ ' I '! 1 !-! 4(： 如 C 

反之，如果 il II 一 rl!‘P 对某个 r >0 成立， x ^- ev , 则 （5.4. 】 3) 给出4、等式 

I! J- lla — ! *.r ! < II x |! || ,r !| n = -J- Il J" T - 

所以 ll^ll J ' lk . 如采 . r #0. 可以利用这个不等式证明其反向不等式，因为 



这里，用到了对所有_>，式0有11 IU || <1从的事实： C: aU rh y -S C hw arz 不等式保证，当一_ 
个 Eudid 单位向量平行于一个固定的非零向量时，这个给定的非零向量与这个单位向量之间 
的内积的极大值会出现，因此， IU- II <&li .r |L, 对所有 tGV 成立.它与已证的反向不等式 
一起证明， II^HI =^\\ T !|,对所有成立，当时，最后的论断成立，并且说明 
Eudid 范数是仅有的等于自己的对偶范数. □ 

作为最后一个注释，我们要说明一种有用的观念，在这种观念下，一个向量与一个向量范 
数一样，也有一个对偶. 

5.4.17 定义设 xec" 是给定的向量， Hi 是 c" 上给定的范数.集合 

L v & C™ ： li v r J- II — y'jr = 1 } 

称为』 '的关于 Hi 的 对偶. 如果 .V 在 X 的关于 范数; 卜 il 的对偶中，则向 M 的有序对 (-r, y)e 
c r, x c 就称 为关于 ||*|| 的对偶对. 

由推论 (5. 5. 15) 可知.如果 HI 是向量范数，则每个向量 •!■£(：" 关于 | 卜 || 的对偶是非空 
的.它可能由 •个 点或多个点组成.例如，如果 IH = |!叫| 2 ,则每个向量 J'ec" 的对偶是向 
最I本身.另外，如果 Ml 二 H ，则1=[0. 1] T 的对 偶由… 个向量组成，佴 _r=[l，l] r 
的对偶包含无限多个向量. 

习鼉 


1. 注意， （5. 4. 5) 可等价地叙述为 

( II • iL » il * llfi) || ^ ll* 3 c M ( II -1|„, | • il^) 

其中 C,( .，‘）和（：„( _ , . >表示与 （5. 4. 5) 中的相应范数有关的可能达到的最佳常数.证 
明 cm，HU = C m UI -:L. 

2. 用 C,„(||，|L, IHU 和 ll.ll r ) 表示 c„( Ihiu ll.u, 其中，有关的常数不 

一定是可能达到的最佳值，对做同样的表示， 
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验证右 边附表 给出了 M 和 k 范数之间的最佳界 

〔V II .IL ■ II . II ,,);即 IU II ^ II ,,对所有 ^ec 



4 n 


=1, 2, 〜成、 >:. 在每种情形，举出一个非零向鐘』'使得 2 ； j i 「 

II x i = un [|,, 说明所给的界是可能达到的最佳界.关十 ' | VM 

a 佳下界 II ll^c I ，- II , 的表是什么？提示：参看习题 1. ^ ! 1 _1- 

4. 证明，如果实或复向量空间上的两个范数是等价的，则它们的; t 系可以用像 （5. 4. 5) 屮 


耶样的两个常数及一个不等式联系起来.提示：考虑在 I 1 - Iy 的单位球 S 上的/(』）一 1/ 


如果 / ffs 上尤界，则存在序列 U、「） 匚 s , ti 适合 U 、. i< 士及 II = 这与 


ll * IL 和 IhL 的等价 tt : 相矛盾.注意，这与有限维性及紧性没冇任何又系. 

丨诎明， （5. m 中的函数八有性质：当 …时， 对毎个有0; ^ k , j — 
时 ，II /* 人 llr— 0;而对每个 k -^ 2 , 存在某个 J > k 便得对所冇都冇 | a - >P. 

因此，一个序列在某种意义下 MJ ■能对一种范数是（逐点）收敛的〔: auc hy 序列，而对另一种范数 
则不是 Cauchy 序列. 

S . 设 V 是完备的实或复向设 U 〜丨是 V屮给定的序列，II *||是V 上 给定的范数. 


如果存在 M >0, 使得^ 11/1 对所有。=〗，2,…成立，证明用 y "’ 二定义的 

部分和序列收敛丁 V 的 个 点.这推广了关于实数的无穷级数的 收敛件 的什么定理？ 

7. W . 明对每个‘有 f | t II II / |;卜 

8. 如果 «>0 11 ML^a II . |i . 证明 （ II ■ U ”一（ 1 /«) II . ir . 

9. 证明，对任意{>1，范数的对偶范数是范数，这里， g 是由关系 l ,7+ l / g =： l 定 
义的. 提示： 用 Holder 不等式的一般形式代替 (5.1 11). 

10 . 设|卜||。和 'I -1!,是 c ’- 上两个给定的范数，弁 a 假定存在某个 c ’> o 使得 || x il < 
c ^对所有/ e c 成立.证明 II j ' IIK ^' II L u 对所有 i & c " 成立. 提示： 


- max -# 4 - > max { ^ 二备 max | y'jc |. 
ll -r !l„ >->' C || _v || lV (, I ”,「1 

11- 证明， li * ir 的等距变换群总包含 IIHI 的所有等距变换的伴随组成的集合.由此推出， 
ii _ r 的等距变换群恰好是由 IHI 的等距变换的伴随组成的集合.什么时候 ii _ i ; 与 | 卜『的等 
距变换是一样的？ 

.设 IH 是 （ T 上的向景范数. H . 设丁 6 M ,,. 证明，如采了是关于 HI 的等距变换，则 

Ml ? - i ;- ir . 


1 3 .设 HI 是 c n 上一个给定的范数. u ) 说明零 14 量关于 ||*||的对偶总是 { 0 }. ( b > 试用推 
论 (5. 5. 15) 证明，每个的对偶是非空集合. 提示： 如果||> !r = lii % x = | l _ r || ，确 
定々()使 _>■ o 在的对偶中. （ c ) 设1|._|是 Eudid 范数||.|| ? .证明每个」的对偶是 
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d (d ) 设 ||-|! = IHI .. W 明 7 — 的对偶 的对偶是从的 
两条线段 . c e ) 设 ii• !i = II- ii,. 证明 . [D 的对偶是 ■jfi]! 1 ， 而」 -“[D 的对偶是从 

— il 到再到 — G ] 的两条线段. （ f ) 证明， >' J ' 的又于 M 的对偶中当且仅 H .! 在 

的关于 II 的对偶中 . （ g) 证明，对每个 /tc% d 关丁 _ IH 的对偶屋 r-l!：. 

1 . 1 . 考虑由 /(_r)= I j-iX, I" 给出的函数 /: R -R. i£ 明集合 u: /(.r) = ] 丨是 f: 紧的 . 
这与 （5 . 4 . 8 ) 孑盾吗？ 

15 . 考虑 TF_ 文巾给出的圯上的一个准范数 /(j.) 二 （！ |_r|L '|.,.|\) |; 的例手，艽屮 

I : 1 " u 二 il M 0丄 [，人 :] 7 I : 

〖 I ，II.厂 II [‘;、 ，i(U || 


证明， •‘申 位球” ueir : /⑴在第一象限内的部分以线段 々 = i // Ry ， 线段 . ri = l / v i 0 和 
一段双曲线弧々々为边界.试両出这个集合的草图并且证明它不是凸集.为什么该“宇.位 
球” 在 其余二 个象限中的余下部分可以通 H 这个集合依次对各坐标轴的反射来得到？证明，对偶 
范数的单位球 U 6 R % / ) <^ ) <1}在第一象限以线段， |/ 】 0+々=7'历和线段. 1 . | +々/10=/〗0为 
边界， 而/ 1 的整个单位球可以通过它在第一象眹的部分依次进彳 i 反射得到，并 . R 它足凸集 .w 
明，的单位球在第一象限内的部分以线段 a 二 V 、/可.线段 a = I , V ' ] 0和线段+ a -11. 
(10 为 边界. 该单位球的余下部分可以通过这个集合依次对备坐标轴的反射来得到.且它是 

ft 集.最后把的单位球与/的单位球作比较：证明前者正好是后者的闭 凸包. 

设 HI 1 v^R" 或 cr 上的向量范数.证明 








证明 c IM < IU ir 分 'J J !| 对所有 .re V 成立 . 所以，儿 K 常 数给出 每 t 范数与其別偶 
范数之间的这两个界 . 

17. 设/(…是^或 C ™ 上的准范数，证明 

广（)0二 max Re y\r — max | v' ‘/ | 

Z <.!■!'. I n I ~)： 1 " 


/(.r) t 

关于这种想法的另 - 个例子可参看 （15 . 6 .]) 卜面的练习 . 




(5. 4. 18) 


进一步阅读关于各种对偶范数的讨论见 LHo U 61 J. —个准范数的对偶是一个范数的思 
想似乎应厲于 J. Von Neumann, 他在下述文茕中 i 寸论 / 度规函数（我们称之为向量范数）： 
“Some Malrix-lnequnlities and Mctrization of Malrir-Spacc," T,msk Univ. Rev, 1(1937), 
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205-218. 这篇文章更容易从下述 Von Neumann 的著作中找到 ： Collected Works ^ voL 4 , ed , 
A * H . Taub » Macmilliar , New York t 1962. 

5.5 向蛋范 数的几何性质 

向 M 范数的原始几何特征是它的单位球，通过它，可以透彻理解有关范数的重要性质. 

5.5 ■丨定义设|卜||是筅或复向 M 空间 V 上的向鼋范数， X 是 V 的一个点，且设 r >0 是给定 
的.以 J 为中心， r 为半径的球是集合 

S ||.|| <r:x) = { V e v ： il JJ — -1- |l ( r }. 

HI 的单位球是集合 

b . ^ b , a ； o ) = {>■ e v ： || 7 1| 

[28 lJ 练习证明，对每个/ ">0 以及每个 . r 6 V , B ( r ； s )=[ r + y t 0 )}=t hB ( r f 0). 

一个以任意点/为中心的有给定半径的球与以零点为中心的有相同半径的球看做是一样 
的； 这只要把零点平移到 x 点就 可以广 单位球是范数的一个几何缩影，因为齐次性，单位球 
刻划 r 范数的特征（实际上只需要 b . 的边界 >. 现在我们要确定，究竟 c " 的哪些子集可以是 
某个向量范数的单位球. 

练习両出 R 2 上的4和/.范数的单位球的草图.它们之间是否存在包含关系？哪些 
点一定在 R 2 上的任一 0范数的单位球的边界上9画出几个 G 范数的单位球的竿图. 

练习如果 I 卜 IL 与 ll *_ b ■是向1空间 V 上的两个范数，证明 ， IU ||„ Slk L 对所有 
V 成立，当且仅当因此向童范数的自然偏序关系可以用几何的包含关系来表示. 
当一个范数乘以一个正常数时，笮位球会发生什么变化？ 

练习如果 H 是 v 上的向 m 范数，乂如果: 》_ ev ， 且《是使||奴|| = lull 的纯量•证 
明《=03戈 l « I =1，由此得出，每条“射线” { tw .: Q >0} 与 ,1.1! 的争位球的边界恰好相交一次. 
5.5.2 定义-个范数称为是多而的， M 指它的单位球是多面体. 

练习哪些匕范数是多面的？ 

练习如果 HI 是多面范数，如果是非奇异矩阵，||.|^是多面范数吗？ 

开集和闭集这些基本的拓扑概念在具有范数的向呈空间中是很容易定义的， 

S . 5 .3 定义设 hll 是实或复向 M 空间 V 上的范数， S 是 V 的子集，点 _ res 称为 S 的内点， 
是指存在 E >0 使 iKs ; 集合 S 称为开集，是指 S 的每点都是 S 的 内点； S 称为闭集， 

是指它的补集是开集. s 的极限点是这样一个点』 ev ， 它对某个序列(关于 HI ) 有 
lim S 的闭包是 S 与它的 极限点集合的并集. S 的边界是 S 的闭包与 S 的补集的闭包 

_ 的交.集合 S 是有界的，指的是，存在某个 M > 0 , 使得 ( M ; 0)，集合 S 是紧的，如 
果可以从每个用 J 卩集作成的复盖中选出有限多个集合\ 使得 

练习证明任意实或复向量空间 v h 的任何范数的单位球 ij 是有界闭集. ' 

练习设 v 是有限维实或复向鼋空间， Stzv 是有界闭集.利用对某个《有 V 同构于 R " 
或 C " 的事实（见附录 K ) 证明 S 是紧集. 
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5. S .4 论断如果||_!|是非平凡 （ BIH 自零维）的实或复向量空间 V 上的向貴范数，则0是单位 
球8. ( 的内点.这可由范数 IH 的齐次性及正定性得到，它蕴涵 S IK ( + ; 0) 匚 B iHI (1; 0); 
R 前者的边界处在后者的内部. 

5. S .5 论断 向量范数的单位球是均 衡的； 也就是说，如果 j ■在这个单位球中，则对适合 
UI =1的所有纯量 a , 也在该单位球中.这一结论可由向量范数的齐次性得到. 

5.5.6 论断 有限维向量空间上的向量范数的单位球是紧集，因为向置范数的齐次性它是有界 
的； 因为范数总是连续函数，它乂是闭的.在有限维情形，有界闭集是紧集，但在无维情形， 
有界闭集不总是紧的.要经常用到的紧集 ft 质是 W e i e rst rass 定理（附录 E ): 紧集 h . 的连续实 
值函数是有界的；并且在该集上达到它的上确界和下确界.因为这个理由，我们经常提及这种 
函数的“极大值”和“极小值”. 

练习 考虑由具有可数多个分量的向董 ^=(1,) 组成的复向量空间它的范数是有限范 
数的&然推广 

ii .r II? = ( 2 I O' 

6=1 

证明，对每对不同的单位基向量和〜，2, # || e f - e , |1 : =72. 因此 

的任何无穷子序列不可能是 Cauchy 序列，所以不可能冇任何收敛的子序列.由此可知&的单 
位球不可能是紧集. 

5.5.7 论断向童范数的单位球是凸集. 

证明： 如果 IMI<i ， IMIO, 且 a e[o, 1 ], 则 

II or + 0 II < II or II + || (1 -ff).V |j = tr |U || + (1 - a) || || < a + 0 - a) < ], 

所以 aJ ：4_ (1— cr ) jr 也位于单位球中. 门 

上述关于范数的单位球的这些必要条件也是刻划范数特征的充分条件. 


5.5.8 定理有限维实或复向 M 空间中的集合 B 是 V 上一个向量范数的单位球，当且仅当 ii 
是： （ i ) 紧集， （ ii > 凸集. （ iii ) 均衡集， （ iv ) 以 u 作为内点. 

证明： 我们已经得知条件 （i ) 〜 （ iv > 是必要的，为 f 看出它们对范数定义是充分的，考虑 
任意非零点 rev % 作从原点到 j •的…条射线线段在这条射线上，用原点到单 
位球的边界上的唯一一点间的线段长度作为一个单位，于是 T 的“长度”定义为沿该射线从原点 
到^的比例距离，更形式地，定义11:^1为： 

j II II =0，如果 1 = 0， 

{ II ^ ii min jy > 0 ^ 6 b | , 如果 x #0. 

这个函数是有意义的，有限的，且对每个非零向 M 上晶 正的，这是因为£是紧集，且0是 B 
的内点.利用均衡性假设容易看出 || ■ || 是齐次函数，所以，余下只需验证角不等式.如果^与 
〜 是给定的非零向量，则1/ lixll 与>>/ lljll 是 B 的边界上的单位向量.由凸性，向量 



關 
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也一定在 W 此，“11&】.且易算出，这等价于在 lla _|! + ll _ vll . □ 

练习给出 （H 8) 的证明 细货， 仔细注意四个假设中的每一个各用在何处. 

我们熟悉的所有 G 向量范数都有这样的性质，那就是 II . HI 只依赖于1的各元的绝对值. 
|2_81]此外.每个范数足: r 的各元的绝对值的递增函数.这两个性质不是没有关系的. 

S .5.9 定义如果 r = U ] SF ( R " 或 C "), 定义 U I < i ]. 我们说 I : | < | j | ,是 
指 U 」 < | % | 对所有< =1, 2.…，《成立. F 上的向量范数 HI 称为 
U ) 筚调的-指的是对所有 . .V6 F 1 , ! -r | < I JJ 蕴涵 || .r il < li li ; 

( b ) 絶对的.指的是对所有』 er 有 II _T II = |! ; 1 I ! . 

5. 5. 10定理 F < R U 或 C ") 上的范数 iH 是单调的当且仅当它是绝对的. 

证明 ：如果 11.11 是单调的 ， a . ( _ er , 设 — v 二 i .h . 于是> j > I < U I ， 且 I < 
b I ，所以 b : I < IU il fi iU II < II y : l ，因此 M 是绝对的.如果 II ■ II 是绝对的，设 
. rzrjjer 是给定的向量，设6是 给定的 整数，且乂设 a ei _ o , ij . 则 

ii r , i - i ，… ： j > I >a 2 1 ij -*. I ，-- tj „] ( I ： 

: I 1 — a)[j i !'■* , ‘ 一 j - ; . J 、,, ， … . j „] ; + + (1 — r 十 ar I 

< 去 (1 — a) II [J 、 ， … .Xi-, , — .r t ,. 1 \. ,. … ’.d i| + -^-( 1 — a) || X |[ + or || .r || 

— yd a ) !l -r || t ~ u a ) ".HI f a II .r |i = lij . il . (5. 5 ‘川 

范数是绝对的这一假设条件只用在倒数第二 t 等式中.对各不相同的分量 S 复应用 （5. 5. 11 ) ， 
可以证明绝对范数有性质：对每个/€^"及“&「0, 1] 的所有选择. ^-1, «, 

II 「 ai ， … ， a,,.。,] 7 || ( .1 [ 工 I ， … J,,] 1 It . (5.5.12) 

最后，如果 u | < I J i ,则对每个 A =1, 2,….〜存在实数 m 和 且奶 e [ o , 丄],使 
•>■,-^'"*3.,. 于是，利用绝对性便冇 ■ 

I! ■»' :1 _ II 「 a, 1 ， "w'v„ .1 li = I 1 [山 I ,yi I，- •- ,a„ I y„ [] r II 

< II [I ,vi I""，I , v , I ] 1 I ! = II .V | i ， 

所以这个范数一定是单调的. □ 

不等式 (5.5. 11 发我们提出稍弱的单闢件概念. 

[2?5] 5. 5. 13定义 F"(IT 或 h 的向 tt 范数 H 称为弱单调的.是指 

|| Ui . — ,| < !| [ x , ! ，.^ . j-fi II 

对所有 r 及所打 ^-1, 2, n 成立. 

如果范数 II _ I 『是弱单调的，乂如果 《 e [ o , 1], 则 

II L-^i '**■ I -axt .J'jh ， …. 工 ,」 7 . |[ 

=II U — *'• -J't -i ， 0 1 ， *■■ f.r,,] 7 " + a.r | 

< (1 — a) II [，i - … ， .r t , “)，jv , 1 ■■* ^„] T II -i-a |! .c || 

^ C1 — a) || j' |l \ a || l! || j II . 






向量范教和矩阵范教 


20.H 


所以弱单调范数满足较强的条件 （r>. 5. 12). 因此，如果在弱单调范数的单位球面上给定一点， 
E1 该点的一个坐标变到零，则这样产生的整个线段一定在单位球内.单调范数显然是弱单调 
的， m 是，反之不成立，这正是下面的练习要证明的. 

练习证明顶点在 ±[2. 21 T 与±「1，一 1T 的平行四边形是圮上的一个向量范数的单位 
球，且这个范数不是弱单调的. 

练习函数 / U)= I I -f I X, I 是 R 2 上的 向鲎范 数吗？它是单调的吗？它是弱单 

调的吗？画出它的争位球的草阁. 

练习设 HI 是史上的绝对范数，证明，如果. r = 是单位球边界上一点，则 

[lx,， 丄々] T ( 所有四种可能的选择)都在边界上.举例并両出叱上的 - 个非绝对向 M 范数的 
单位球的草图.说明它的几何性质.在 R" 中会出现什么情形？ 

练习画出 R : 中顶点在 ±[_0. 1]、 丄 []■ 0] r 和±[1, l] j 的多边形的 草图. 说明它为 
什么是 R" 上的 •个弱 单调向 M 范数的申.位球，而不是单调或绝对向 M 范数的中.位球. 

向 tt 范数的单位球的凸性具有昨多往往是今人惊叹的深刻结论.其中之一是下面的对偶件 
定理，我们一般从准范数的角度来叙述它.所涉及的基本思想是很0然的几何思想，也就是 
说，包泠某个集合 S 的最小闭凸集（闭凸包 Cos ; 见附录是包含 S 的所有闭半空间（在超平 
面一边的所有点）的交，并且，如果存在这样一点 h 只要 S 位于一个半空间内，_!也就位于 
这同-个 f ■空间内，则〃必定属于 S 的闭凸包.这些简单的概念直接导出一个重要结论，一个 
向量范数的两次对偶等于原范数. 

5.5. 14 定理(对偶性定理）设 /(•> 是或 （ T 上的准范数，设广表示/的对偶范数，而 
尸®是的对偶范数，乂设 

B = [j e V：/(x) <1!. 

矿 eh u e v-j Dn (j：) < 1} 

分别表沿 / 的 “单位 球”和的单位球.则 

- Co B , 

因而 / ㈤ u)</Lr > 对所有成立.如果/是 V上的向量范数，则 f w = f . 

证明： 设 jfV 是给定的向量，则 （5. 4. 13) 说明，对任意 
! .V、 K /(.o), 

因而 

严 （ ,r) = max I y 丨 < max =- / (j ). 

1 -i '' 

凶此，对所有成立，这个不等式等价十几何命题 BCif. 

为了证明第个包含关系，采用对偶范数的特征（ 5 . 4. 18) 是方便的，还应知道集合 Of 
V: Re /\<])是包含原点一般闭半空间‘利用对偶的范数的定义，设《&吖是给定的点，我 
们看出， 


“ 6 1 / ： Re f" v < 1，对毎个适合 f l , ( v ) 6 1 的 U"; 

=1，对每个适合 /( u’）< 1 的 w 的每个适合 R e uX 1的 W 
= {/：Re r ^55 1, 对所有 6 召的每个适合 Re tr 、< 1 的 d 
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这说明《位于包含 B 的各个点的每个闭半空 间中： 即《位于每个包含 B 的闭半空间中.因 
为所有这些闭半空间的交是 B 的闭凸包 Co S， 得知 《6CoB . 然而点是任意的，所以 
JfCQWi， 因为 Co 衫是包含 B 的所有凸集的交，我们也有 CoSCB% 因而 if = CoR 

如果准范数/实际上是范数，则它的闭单位球 B 是凸集，因而 B = CoB, 所以 BCifC 
HI!] b ; 因而 b = jt . 因为它们的单位球是恒等的，所以范数/与/»相同. □ 

对偶性定理的一个应用是下述有用的结采.它是泛函分析中的一个重要的一般结果（称之 
为 Hahn-Banach 定理)关于有限维形式的特殊情形. 

5 . 5 .15推论设 jec" 是给定的向量， HI 是 c" 上给定的向童范数，则存在向置 ^ec" 
使得 

(a) I (，,）、.丨 < |U II 对所有 xeC 成立； 

( b ) ( W = || 3-11 ■ 

向量不一定唯 -， 不过 II %且 ibii. 

证明： 我们知道，根据对偶性定理， 

II y II = ( II 3 > = max \ y ' z \, 

II d. J 

并且由向量范数 ii_r 的单位球面的紧性可知，该极大值实际上可由某个（不一定唯一的）适合 
1U 的达到，因而 II y \\= \ y ^ y , | . 用模为1的适当因子乘％便知，可以使内 
积，>为正值，因而 am 被证明.-般，从 (5.4.13) 可知，对所有 i'etr 有 

I k II 3-, run = ik II . 

因此向量> 同样适合 (a). 注意， （flH 兑明 || > || D <1, 而使 || 3>。 r = l . □ 

习题 


1- 证明，集合 S 是闭的，当 JI 仅当它包含它的所有极限点. 

2. 证明， S 的每一点是 S 的极限点，因而 S 的闭包恰好是由 S 的极限点组成的集合. 

3 . 给出一 个既是开集乂是闭集的集合例子.给出一个既不是开集乂不是闭集的集合例子. 

4 . 设 S 是具有范数 11.11 的实或复向量空间 V 中的紧集.证明 S 是有界闭集.如果是 

给定的无穷序列，证明，存在一个可数子序列彳、和一点5，使得 lim 证明 

紧集的任意闭子集是紧集. 

5. 在 （5. 5. 4) 中，如果 V 是零维的，会出现什么情形？ 

S . 如何定义向量半范数的单位球，它的形状与范数的单位球有何不同？画出一个例子的 
[288] 草图. 

7. 如果|卜||„和丨1*11 ? 是一个向 M 空间上的向 M 范数，又如果 11.11 是用 
IU II = max{ || ^ ||„, || T\\ f } 

定义的向量范数，证明 b im = B K ns„Y 

8- 址明， r(R" 或 C) 上的向景范数 HI 是绝对的，当且仅当 

II [ajj-, ,t)r 2 T, ，■-- || || [ti , jt ； , , jr,] r || 

对所有 Oi ， . r 2 , …， Jf „] T 6 F " 和所有适合 I a ! I = — = I I = 1 的纯量 tn ，幻，… ， a , 6 F 
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成立. 

在以下六个题中，要用到下述记号，设 x , 设|卜 II 是实或复向量空间 V 上的向量 

/范数.则 

L(j ,y) = U(f) - x n 

表示 _ r 与间的普通（线性代数）线段， . H . 

C(x,y; || • || ) = {z ^ V ： !| j- - x (I -f || ' jj |j = (I J. — 3, ||} 

表示关于范数 HI 的 x 和 j 的（度量）凸包. 

9. 证明 Ux , ^) CC (^, v ; IH ) 对所有 a .vf V 和任何向 M 范数 HI 成立. 

10. 如果且其范数是范数，证明 C (_ r , w H | 2 ) = Ux , 对所有 yec 
成立； 即证明，111+3^ || 2 = II X - ^ |j 2 + II ^-3- IU , 当 a 仅当 z = x + 7 (：y — i ) 对某个 re 
[0, 1] 成立. 

11. 证明 C ( x，A HI ) 总是一个普通 凸集； 即证明，如果 A , 22 6 C ( x , , y ; II . II ),则 
h + (l —/) z 3 6 C (. r，!H ) 对所有 1) 成立. 

12. 考虑 R 上的 V = R : , i £ 明 C (( l , 0), (0， 1); ||‘|1,)是平面中顶点在点（0,0), 
(0，1)，<1，〗）和（1，0> 的整个正方形. 提示： 证明（0, 0) 和（1， 1) 在 （0, 1) 和 （], 0) 的 
4凸包中，然后利用习题 11. 另外 证明 a ( i ， 0>， （0, 1); i . L ,) 恰好是线段 uu , 0), 
(0, J )), 

13. 冉考虑 R 上的 V = R 2 , 证明（:：（（1， 1), (1， M )； HI ,) 是平面中顶点 （0 , 0), (1, 
1)，（2， 0) 和（〗，一】）的整个正方形.提示：证明（0， 0) 和（2， 0) 在（〗，〗）和 （1, -1) 的 

凸包中.另外证明 CU 1, 】）， （1, -1), ll . IL ) 恰好是线段 LU 1. 1)， （1, 1)). 

有个点的点组 SCV •的度量凸包可以定义为所有这样些 zCV 的点组成的集 
合，使得 z 在两个点的度量凸包中，而这两个点中的每一点又在 S 的某一对点的度量 A 包屮. 
证明，当4 = 2时， 这与 上述定义是一致的，描述 R " 中的一组标准正交基向量 
<,} 的 A 凸包.这个基的凸包是什么？这个基的普通线性代数凸包是什么？ 

进一步阅读关 T 向 M 范数的几何特性的进一步讨论见 [ Hgu 6 4 ]. Vcm Neumann 在 （5.1) 
节末引用的文章中采用 f 证明对偶性定理的关键思想（一个范数或准范数的单位球等同于所有 
包含该范数或准范数的单位球的所有半空间之交).关于凸集，凸包， f - 空间等等的详细讨论 
见 [ Val ]. 


5.6 矩阵范数 


因为 A 1 本身是维向 M 空间，所以可以采用 C' : 上的任一种向量范数来度童矩阵的.‘大 
小”‘但是， A1 不仅仅是卨维向量 空间； 它还有通常的乘法运算，在度量矩 阵的“大小” 
时，建立起 AB 的“大小”与 A 和 B 的“大小”间的关系常常是有用的. 

我们称函数 f ■ j 1 : M„，R 是矩阵范数， 指 的是，对所冇 4， Be K , 它满足 F 列五条 
公理： 
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(1) ：j A !>0, 非负性： 

(la) La!|=o ， 当且仅当 A 二 0, 正定 ft; 

(2) 1 cvA '|- I . i/l'i 对所有复纯 tt ^ 成、 > 齐 次性； 

(3) ■ A-^li '|=iij' .A , 4 I /i 1 , _ 一 : 角不等式 : 

(4) \AB^,A i jH ；；, 次乘性 . 


注意，性质 U ) 〜 （ 3 ) 与向 M 范数 ( 5 . 1 . 1 ) 的公理相同.关十矩阵的向量范数，即满足 （]) 〜 （ 3 ) 
时不一 定满足 ( 4 ) 的闲数，称为广义矩阵范教.矩阵半范数和广义矩阵半范数的概念也可以通 
H 取消公 fflUa ) 来定义. 

对任意矩阵范数打 i -| AA'^：j A 卜 .A I ' 所以对适合 A ' = A 的任意非零矩阵 

—定仃 A 1. 持別足 I 对任 H 矩阵范数成立 . 如果 A 是可逆矩阵， 

WiW . ; 1 -■： .\.\ 1 V .； ,\ 1 . 丨丨冇 卜界 

_ 它对任何矩阵范数;[.〗都成立. 

练习证明.如果 II 是矩阵范数，贝0 /V A :||* 对每个士 = 1，2,…和所有/\£从成 
立.给出一个例子.使得这个不等式对关十矩阵的向量范数小成立. 

与把化 （5. 2) 中引进的某些向#范数应用于向 M 空间 M ,, 时，它们就是矩阵范数，而宥些 
向错范数则不是矩阵范数.最熟悉的例子是/>=1, 2,…时的匕范数，已经知道它们是向 M 范 
数，所以只需耍验证公 MU ). 

例对用 


il A || ! ^ 2 | a tJ | 

定义的范数是矩阵范数.这是 凼为 " 

!1^ ||,= 2 | S 

… ： t I - ) r 小卜 J 

< 公 I « A ,,, =" ( 2 I I) ( 2 I b -> I) 

l . ,* • I S .)n - I 

-= I 1 A ' i： I , H !,. 

第一 个不等 式可以从:《角不等式得到.时第二个不等式是把一些附加项加到和中得来的. 
例对 AeM „, 用 


|:/\||^(2 1〜1 2 广. 

定义的 Euclid 范数或卜范数是矩阵范数，这是 k 为 

hash 卜 2|E^r^S(E r)(E iu) 

•-； r 'l h I ; . I i I m-[ 
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= (2 I ^ 0( 2 I k r) - mm iibi'l 

j I ,j - i 

这个不等式正是 Cawhy - Sdiwarz 不等式.当应用于矩阵时，这个范数有时称为 Fraknius 范 
數， Schur 范数或 Hilbert-Schinidt 范教.如果用 A £? M „ 的列向量 a ,6 C " 表示 A = [ a 
e / w „, 则 

|| AM=|U ||] + … + iu , 

内为 c ‘上的 G 范数是酉不变的，我们有重要的事灾 ： _ 

I; [M | [ 5 i| Uu, |IH~ … - 十 II d il:: = Ik i .f …+ U = II A II ?， 

其中是任意酉矩阵. N 为 || B 1 ; = I B || ; 对所有 sew „ 成立，这蕴涵 
1 VAV ^ - II AV II, = I V*A* j| : - II A* I, = il A|| 2 , 

其屮 u . vew ,, 是任意酉矩阵.因此. H , 上的 h 范数 是酉不 变矩阵范数. 

例对用 

II A II , = ^max I a „ \ 

定义的厂范数是向 M 空间上的范数，但不是矩阵范数.考虑矩阵 J = D 由计 

算可知，尸二 2J . u IU -1, || r - II = II 2J |i =2 il J t =2. 它不适合 il J 2 iU < |j J li 2 .， 

因 IfllllL 不是次乘性范数.但是，如果定义 

ill A 'j = n |! A || , A ^ M „, 

则有 

: .4 B ji max ^ 71 max V | < j * 〜 | 

I S ； '. r-；^. v I ^ ^ ]c.".r. ； i ： [ 

7i 

^ rt max 2 II A II..' II B |U = rt\\ A ||„ « || B ||,, 

1: =： 1 

= ii! A : ; ■ fi I * 

因此，只需要对向量范数 H 作稍许改动就可以使它成为矩阵范数. 

与 c " 上的每个向量范数 H 相关联的矩阵范数自然是由 h , 上的|:_彳“诱导’’的矩阵 
范数.该范数 丨! 是由 II •[ 构造出来的，而这种构造法也是从一种范数产生另…种范数的 
方法. 

S . 6.1 定义设 || *||是 C " 上的向量范数.定义 M ,, 上的|卜||为 
; ! A ij = max |l Aj . II . 

上述定义中取 “ max ” （而不昆“ SUP ”） 是合理的，这 是闪为|| /b || 是 x 的连续函数且单位球 
iM _.| 是紧集（见附录 E ). _ 

练习证明范数 （5. 6.1) 也可以用下述等价方式来计算： 

| A I = _ max 〖 i | Ar I ! = max i | Aj - || , 
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國 


max 其中 HL 是任意向量范数. 

.1/0 || J- II 11、=1 II J- [| 

S . 6. 2 定理 （5. 6. 1) 中定义的函数 |N I 是 M __ 上的矩阵范数， M.r || <|| A | |U || 对所有 
m „ 和所有 lec " 成立，且 lUlhi . 

证明因为 IA I 是非负值函数的极大值，所以本节开头所述公理 （1) 成立，又 = 0 对所 
有 . r 成立仅当 A = 0时才成立，所以公理 （ la ) 成立.由计算可知， 

ill cA l || = max || cAx || = max | f j |[ Ajt || = U -丨 max || Ar || = | c | |/ l |||, 

由此推出公理 (2) 成立.类似地，三角不等式 (3) 被继承下来，这是因为 

I ' ^ + B !)= max || (A + || = max || Ar + Sr || < max ( || Ar j | + || & || ) 

< max II Ar II + max j [ Br [| = f 1 A | + 1 B |||. 

次乘性公理 (4) 可从下述事实 得出： ， 

1峰匪…概贺 
< max "|| 二 Y max =l\ A t' !i B iil' 

这里，不妨假定极大值只取遍那些不在 b 的零空间的 & 对于下一个论断，因为范数 hi 是以 
取极大值的方式来定义的，由此得知，如果1^0,则 II II r II II <11 A |||. 由向最范数的齐 
次性可知 ，II Ax || <| A I ； |[ ^ II ,当1=0时，不等式也成立■最后 

I ^ II = max || U || = max || x 卜 1. 口 

II 厂 =i II ， ， .-i 

S . 6 .3 定义我们称 (5.(5. 1) 中定义的矩阵范数 I _ l | 是由昀量范数 H | 诱导的矩阵范数.有时 
称它为算子范教或与向量范数 HI 相关联的(最小上界)范数. 

注意，算子范数是矩阵范数可以作为所有向量范数的一般性质的推论.因此， -- 种证明 
Ai 上的某个函数是矩阵范数的方法是，证明它是由某个向量范数所诱导的.当讨论称之为谱 
范数的5要矩阵范数时，将采用这种方法. 

定理 (5. S .2) 中所述不等式说明，向量范数||， || 与所诱导的矩阵范数 1.1 是相容的，因时 
这个定理说明了，相应于 C " 上的任一向量范数，都存在上的一个相容矩阵范数.该定理 
也给出了矩阵范数 I _ | 是由某个向量范数诱导的必要条件：|||/|||=1；遗憾的是，这个必要条件 
并不是允分的. 

下面，介绍几个 a 要的矩阵范数的例子，它们是由熟知的夂范数诱导的，不过，不借助 
定义 （5. fi . 1) 也可以计算出来.在以下每种情形，取 4 = 

5.6.4 极大列和矩阵范教 ||| _ I ,在上定义为 

II 1 A I = I [. 

范数 IIMl 』 是由 L 向董范数诱导的，因而它一定是矩阵范数.可以把这一事实证明如下.用 A 
的各列把 A 云风写成 A = [〜■•■“„]. 于是 IA ||:】= pajt |丨 a , IL 如果:则 
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|| Aj ： 111 = II Mi 十…十 tli < q II n IL = $ II a II Ik 111 

6 士 I 1 1 (max || «Jli) = 2 I ^ I I A I = I! jr |L | A fj, 

因而， max t || |K <11^11^ 如果现在选(第方个单位基向董），则对任意方=1，2,…， 
n 有 


11 Ar ||i > || la k ||j = || a k [|], 


因而 


max || At ID max IUJ, e | A | . 

^ f " L -i . . 

因为现在已经证明，由向量范数诱导的矩阵范数既以 I Ail , 为上界又以 | A |;, 为下界，所以 
结论得证. 

练习试由定义直接证明 || i • 1是矩阵范数. 

5.6.5 极大行和矩阵范教 H ,,. 在 At 上定义为 

UL ^^ t \ a v I . 

范数 HL , 是由乙向量范数诱导的， 因而 它一定‘矩阵范数.其证明与关于极大列和范数的证 
明类似.算出 

II Aj : IL = maxi I < max 2 ! a ^. r , | < max ^ | a „ \ || j ： ||.„ = || A | J _r ||〜 ， 

Js w J = i j = l = ] 

因而 n^x II ||.<||;.4 ||„. 如果 A = 0, 那就没有什么要证明的，所以可以假定 A 垆 0. 假定 
a 的第 々行 非零，且定义向量 「[ dec 1 为 

= | j ，如果 a h ^ 0 \ 

U ; ] ，如 果如 = 0. 

于是 IMI .=1， 且对所有）= 1，2,有丨〜， I ，并且 

[| Ar ||. > || A* ||.„ = max | 2 At | > | | = S I a *> I • 


因此 


证毕, 


max || Ar ||„ ^ maxS I ^ 1=1^1，. 


练习试由定义直接验证 |N j 是 M „ 上的矩阵范数. 

5- 6.6 谱范数 HL 在上定义为 

I A | = max{VA = A 是 A * A , 特征值 }. 
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注意，如果 A'Aeh'a. ， 判， 则 J-VVA 厂 P/LHI 卜 AIUII〗， 所以 A>0 且VI是非负实数. 

练习如果 B 是正规矩阵， J_li3 = VUV , 其中，[_7是西矩阵，…， A,,)， 

证明 

I ,r*R/- |s-^ max I | A | : A 是 H 的特征值！ II 

练习证明 I! Axp=. r ’A:A. r 对所有 .r6C" 成立，然后利用上一个练习证明，】，|| 2 是由 
Kuclid 向 M 范数II *112 i 秀导的矩阵范数.由此得出谱范数实际上是矩阵范数. 

练习证明 |04VL = i A| 对任意 AeM,, 和任意两矩阵 L；，V£M„ 成立. H 此：遒 范数 
是西不 变矩阵范数， 

下面证明，经一个固定的相似，一个矩阵范数可以变换成另一个矩阵范数. 

5.6.7 定理如果是的矩阵范数 ， FI SeM„ 是非奇异矩阵，则对所有 A6M,,， 

;jU ' s = jiS 'AS : i 

是矩阵范数. 

证明： 可直接验证，彳*|,■适合公理（1)， （la). (2) 和 <3)，||卜 i| s 的次乘性可通过下面的 
计算得出： 

AB | s = i| S 'AIiS i = |CS l AS)(Sr l BS) ：| < ,| S *.45 .j : S_1S || = 1 A ||； s 1 B ||| s . 口 
为使矩阵范数适合特殊啬要，定理 （5. 6. 7) 可能很有用.这种形式的某些应用将在这里和 
下一节阐述. 

矩阵范数的一个5:要用途就是给出矩阵的谱的范围. 

5.6.8 定义矩阵 A€M„ 的谱半径〆是 

pCA) = max) I A 丨 ：A 是 A 的特征值}. 

由此坷知，如果 A 是 .4 的一特征值，则 I <^ CA ) : 此外，至少有一个特征值 A 可使 | A | 二 
设 A . i = Aj __ ^^0,且 |Al = p ( A )， 考虑具所有列都等十特征向量』，的矩阵 XeM „. 
并注意到 -4 X — AX . 如果： _ ||是 任意矩阵范数.则 

i A I | X | = !( AX |j = ' l | AX ; || ^ !. A ||| ||! X |j , 

因此 IA I 这便证明了下述定理. 

5 . 6 , 9 定理如果 HI 是任意矩阵范数， R A6M„, 则〆 WCAf. 

练习试给出一个例子，使矩阵 f 的问 M 沲数|1*|1和矩阵 AG.H, 适合 It AilkpCA). 

练习设 i| ， | 是 R 上的矩阵范数，考虑映射 F: C"-M „ ,它定义为 - x]= 
M„ 巾其所有列正好都是的矩阵.试证用 || ， |i _ FO)i|: 定义的 C 上的函数 丨| ，li 是 C’ 1 上的 
范数，并 a 证明，对所有 KC" 和所有 A£M„， 有 ||Ai||<HU||. 这个不等式说明，向 
M 范数 HI 与矩阵范数 i _ ii 是相容的，而这个练习说明， M„ 上的仟意矩阵范数在 C 上有一个 
相容向量范数. 

虽然谱半衧阐数本身不是如„上的矩阵或向量范数（见习题 19). 但是，对每个固定的 A6 
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M „, 它是关十 d 的所有矩阵范数的值的最大下界. 


S . 6 .10 引理设 AGM ,」， a e >0 是给定的.则罕:少存在一个矩阵范数 I . i 使得 〆 A^il Ag 


"( A ) + e . 


证明：根据 Schur 二角化定理 （2.3. 1), 存在酉矩阵 (7 和上二角矩阵 A 使得 A = 
令 D ^ ciiagG , 〆 . 广）.由计算可知 * 


D 減 


U , r l d ]2 

o A , 

! 0 0 

I 




^ ,Hl 九 

i 

i 


oo o n ) 

.0 0 0 0 A , 


因此，对足够大的/>0， pf 以确信， D t AD t 1 的所有诈对角元的绝对值的和小于 I 特别是 t 


我们可以肯定、对足够大的/有 | d , ad , 这样，如果定义矩阵范数 ii . I 为 

Rl= ： D,U'BVD, 1 ：!, = 丨）丨 ）||,. 

艽中 BeM „ 为江意 矩阵， X 如果选择足够大的“则可以构造出适合, | L 4, K p (/\)+ £ 的矩阵范 
数.因为 IA |>. p ( A > 对任何矩阵范数成立.我们完成了证明. □ 


练习说明为什么 t : 述结果证明 l >( A )- inf {!|, A'l : li | •彳是矩阵范数}. 

我们的兴趣在于刻划当-«时 A 1 — 0的矩阵 A , F 述结果是着手解决这个 问题的 最后一 

个工 


5 .‘ 】 1引理设 AeM„S 给定的矩阵.如果存在矩阵范数 | 使得 ^Allk.l , 则二0: 
即当4—〜时 Y 的所有元都趋？零. 

证明： 如果则当时有 . V |<14|卜 0 .这说明，关于范数|.彳|， -0, 
但是. W 为 W 维空间 M ,, 上的所有向量范数是等价的，所以，关干向量范数 f ,|| L ， 一定也有 
A 〜 0 ‘ □ 
练习试给一个例子，使矩阵 .4 和矩阵范数:|! . i |.。 ， f | ■ 适合彳 , A L <1 和 iM |>1 .其结 . 
论是什么？ 

适合 ji+m 的矩阵称为收敛的，汴且，在许多应用中，例如，在迭代过程的分 

析中，这样的矩阵是很有用的.因此， S 要的是能刻划收敛的矩阵. 

5.6. 12定理设 A 6 脱,.则 jimA ‘=0 气且仅当 〆 A )<1. 

证明： 如果0，又#0是适合 Hr 的向量，则权气 U I <1时才有 ASl 
(| -因为 I A I <1对 A 的每个特征值 -- 定成立，得出 〆 A )<1. 反过来，如果 〆 A )<1, 则根 
据引理( 5 .6」0)，存在某个矩阵范数 ! f 使得因此由引理 <5. fi . 11) 可知，当 々一™ 时 
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统习考虎矩阵 A=pf JJe M 2 .对 A =2, 3,…，直接计算 A * 和= 

_ [ p ( A )]'. 当时，下列各种情形如何变化？ A f 的各元；|#||, ; | A * i >; ||' A * ：| 3 . 

结习设為=[— S 用递妇式6 = 0, 1，…，定义由向量 
L _ 1/8 1/2 J 

ec : 组成的序列.证明，不论第一个向量/〜如何选择，当 a — 00时 o . 

有时，我们需要知道当时，关于 v 的各元的大小的界.一个有用的界是前一个定 
理的直接推论. 

5. 6. 13推论没 AGM , 是给定的矩阵， e >0 是给定的数.则存在常数 C '=(:( A ， e ), 使得 
! D>(A)+ S )* 

对所有 4 = 1, 2, 3, …和所 有纟， j = l , 2, 3, ■■■, «成立. 

证明： 因为矩阵叉二 [ P ( A )+ e ] 1 A 的谱半径严格小于1,所以 S 收敛，因而当 A — oo 时 
0. 特别是，序列卩 1 }的各元有界，于是存在某个固定的 C >0, 使得丨 | < C 对所 
有々 = 1, 2, 3, …和所有 j = l , 2, rl 成立.这就是所要确定的界. 口 

练习设4 = ^ j , 直接计算 A *, 说明在 (5. 6. 13) 中不能总取 E — 0. 

当办 — co 时，虽然不能像 〆 AP 那样确切地说 ( fiA * 的各元的变化情况，然而，对任意矩 
阵范数 H ， 序列 (|| ||卩的确具有下述渐近性质. 

5. 6. 14推论设 II _ | 是 M , 上的矩阵范数.则对所有 AGM „, 有 
pCA ) = lim ；;| A 1 I ' ，f . 

证明： 因为 〆 所以，对所有4=1，2,…，有 〆 A ><| A | r . 如果 
e >0 是给定的，则矩阵 A =[ p ( A >+ £ ] 的谱半径严格小于1，因而 S 收敛.因此，当是叶 
〜时|11||—0, 且存在某个 / V = NU ， A ), 使得 ||. S *|<1 对所有太成立.这正好说明，对 
所有 劍, 有 iia * ikua )+ £ ]* 或 | a [ 因为 〆 axiiia * ir 对所有》成立， 
\ zn \ 乂因为 e >0 是任意的，由此得出14114 |卜*存在且 等于 〆 A ). □ 

正像处理向童的无穷序列或无穷级数那样，也可以用向量范数处理有关矩阵的无穷序列或 
无穷级数的收敛性问题. 

练习设 M t } czJW „ 是给定的矩阵无穷序列.证明，如果在上存在向量范数 HI 便得 
数值级数 il | A *| l 收敛（以致它的部分和有界），则级数收敛于 M a 中的某个矩阵.提 

H t=U 

示：证明其部分和构成一个 Cauchy 序列. 

关于矩阵的一种特殊情形是矩阵的幂级数情形，这在研究向量的无穷级数时没有出现.但 
是，因为矩阵范数的次乘性质，容易给出关于矩阵幂级数收敛性的简单的充分条件. 

5.6.1 S 定理设 AeAf „， 是无穷级数，如果存在 M „ 上的矩阵范数 I . || 使得数值级数 
£-0 
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2 I 1 :|: A ||| f 收敛，或者这个级数的部分和有界，则级数收敛. 

k - -J 去 = l ) 

练习证明 （5.6.15). 

练习用例子说明，有可能级数收敛，而级数 f Ud | iA |「 发散.这类似于数 

k-u *=0 

值级数的条件收敛（收敛而不绝对收敛). 

练习设函数 /( W 是用幕级数/(幻=定义的，它有收敛半径尺>0,且设 f *| 是 

* = 0 

M ,, 上的矩阵范数.证明 /( A ) 完乏对所有适合 jA | l < i ? 的 A 6 M ,, 有定义，更一般地， 

卜0 

证明 /( A ) 对所有适合 〆 A )< ii 的 AGA /„ 有定义. 

练习如果4是可对角化的，且 A = S -_ MS ， 有时定义 /( A )^^ ' f ( A ) S , 其中 f { A ) = 
diag (/( A 】>，/ U 2 ) ，…， f ( U ). 证明，如果 A 是可对角化的，则 /( A > 的这个定义与上一个 
练习中的幂级数定义是一致的.在这两个定义中，哪一个比较通用？ 

练习证明用幂级数 



给出的矩阵指数函数对每个 AtA ^ 都有定义. 

练习应如何定义 ra s ( A )? 这对什么样的4有定义？ 

5. A . 16 推论设矩阵如果存在矩阵范数 | H | 使得 A |<1， 则 A 是可逆矩阵，且 

A 1 - Y ： (I-A) 1 . 

证明： 如果 |U — ,4 l < l , 则因为级数的收敛半径是1,所以 

^ a ~ A)t 

收敛千某个矩阵但是，因为 JV — co 时， 

‘V .V 

A )* = [/— a — 乂 ）]^](1 — a )* = i - ( j - A)^- 1 - 1 , 

所以，得出 n □ 

练习证明上述结果等价于下述 命题： 如果 H ! 是矩阵范数，又如果 || A |<1, 则 J . A 是 
可逆矩阵，且 

' U~Ar' = 2 A *. 

k = [) 

练习设 I • I 是 M ,, 上的矩阵范数，且假定给定的矩阵有一个具有性质 ||BA — /|< 
1的“近似逆” B 6 M „. 证明 A 和 S 都是可逆矩阵. 

练习如果矩阵范数 HI 有 || U ||!=1 的性质（如果它是诱导的范数，它理应是这样），乂如 
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果 AeM ,, 适合证明 


1 + ' -4 I 


< ： i(/ - A) ' K ■ 


■ M，i 


■ 


提示： 利用不等式/一 .4r1l<E 可得到上界.对于下界，则利用一般的不等式I汗 

i-il 

1/||3;|和=角不等式. 

练习 如果％ _il 是一般的矩阵范数，我们都知道 i|_ ill 会1,在这种情形，证明，只要 i|A_ l: < 


〗.就# 



: 1，1 + 1 尤 |1 


( ki - A )- 1 1^ 


1 - 1 A j ! 


练习 如果 «eM„. ,4是可逆矩阵.又 A + fi 是奇异矩阵，证明:|,叫|:>1/ ; A \彳对任 
何矩阵 范数」 *||成立.因此，可以用一 个竒异 矩阵去充分逼近…个非奇异矩阵，不过有一个内 
在的限度. 提示： .A + B = A(/+A- 1 B ). 如果 I/A l B ， ii < l , 则应该是可逆的，因而 
有丨 A 'B ： i > l . 


关十可逆忡的一个有用而乂容 S 计算的准则不难由上一个推.谂得出. 


5.6.17 推论设焱=[\|6从„. IL 假定对所有，二丨. 2,…，/；有 

1 ! > E ! S - 

j I 

则 A 是可逆矩阵. 

证明： 假设条件保证所有主对角允义,是非零的.令 D = di a g( Ull ，…， a m ), 则 D 是町逆 
对角矩阵， i > M 的主对角线上都是 1. = f — D _ M 的主对角线上都是零，_0_当， 

时\ 考虑极大行和范数 iH.,. 假设条件保证 iBli, <K 于是根据 （5.6. 16>, J — 

B — D M nf 逆 ，因曲 A 可逆. □ 

满足推论 （：i.6. 17 〕 的矩阵称为严格对角占优矩阵.这个可逆性的充分条件称为 [,evy 
Desplanques 定埋，并且可以对它们作稍许改进.见 （S.1) 节， （6. £) 节和 （6. 4) 节. 

现在更洋细地 H 论 （H 1 〗 中的诱导矩阵范数.这是一些最常见的矩阵范数，并 X 它们有 
一个®:要的极小忭质.因为常常滿要采用检验〗 A _||<1 的办法证明 - 个给定的矩阵 A 收敛，所 
以那些尽可能一致小的矩阵范数然受到偏爱.正如要证明的那样，整个诱导矩阵范数类有这 
种合意的性质，并且这种性质刻化 f 诱导矩阵范数类. 

冇限维空 N 上的彳[意两种范数是等价的.所以，对每两种矩阵范数 H . 和 存在一 
个最小的有限 _ iE 常数 C .、,( a , (3)，使得#)彳 A ! l | fl 对所有 A & M ,, 成立，这个常数可 
既1 以用 



来计算，如果将《和0的作用颠倒过来，则一定存在一个定义类似的最小正常数(：„(/?， a ) ，使 
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得| tt)|L4|L 对所有 AtM, 成立.一般地， 两个常 sc„( a , 炉和 LW，d 之间没 

有明显的 Jt 系，不过，如果我们考察本节宋习题 23 中的表，它的左上角的 3X3 数表是对称 
的：即 cv( a , p=c lU ( / j, 对」个矩阵范数, H, ，！| .美和!| ■ i|L 中的任意一对都成立 ■这二 
个矩阵范数都是诱导范数，而上述对称性是所有诱导范数的一个 性质. 


5.6.18 定理设||‘||„和 Il_lb 是 C 1 上两个给定的向量范数，且设 il.IL 和 1 . .1, 表示 K, 卜的 
相应诱导矩阵范数，即 




II A r ;.|。 


定义 


特别是 


W ：jA!l^max^i 




(5, 6. 19) 


(5. 6. 20) 


从. 

证明： 设和 t 6C 是给定的， il 假定 .r 古0和九 i ，关则 

li A /-11 


㈣- 織街 ㈣ 


I 


ITI7 < & 〜心 I A 也， 

M !ii。 


并且，即使 A 」，= 0, 这个不等式也成立 .下是 
|Al; r — HU 
W \(\ i 对所有非零 A G Al 有 

i| A 

( 5 , S. 屮的每个极值都被某个非零向量所 达到. 所以存作向量. y , z ^ C r , 使得 || y II., 
IML = K li >> |I„=R,, II y lb 和 ll sr 心 -二心 || s； IL. 根据推论 (5. 5, 15)， 存在向 M a ec 使得 
(a) UVr ! <IU II, 对所有 _re(T 成- vi; 

<bJ ^^,3：= II ^ ||^, 

考虑矩阵利用 （ M 有 

il A 'H - II >IL _ II yll„ I i I: v IL li ^ IL 

“L — m ra~= !i s il ’ 

所以有下界 


I' : = Mb. 


另一方面，可以利用< a) 得到 
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$5f 


!| Ay- L _ I 1 yz '：：.!■ I,, _ li y |i^ I II 3 1 H II ^ il 


II ^ II , 


因而有上界 


[| -r II , 


IU lb 


lu b 


11 .V ll l3 


ilA L < Il _y "fj- 

合汴这两个界便有 

它说明 （5. S . 22) 屮等式可以成立，因而证明 r (5.6.20). 因为恒等式 （5. 6. 20) 的 心边) (^于 u 和 
0是对称的.所以结论 （3. fi . 21 >成立. □ 

C 上的两个不同的向董范数能够诱导出 M ,, 上的相 Mm 阵范数吗？根据 （3. S . ]8)的下述推 
论可知，这种情形能够出现，当且仅当一个向量范数是另一个向量范数的常纯 tt 倍. 


5.6. 23推论设 II * 丨|。和 II _ L 是 C " 卜.的向量范数. 义设： ■ I ,和_ ■ 1表示 M , h 的相应的诱 
沣矩阵范数.则：对所有吣成立，当且仅当存在一个正常数。使得 ILH ,— 
_ ^11.4,对所冇^6<^成立. 

证明： ？2们知逍. 



因此，冇一般不等式 

n 〉 l ， （5.6.24) 

其中等式成立.当11仅$ 



Ifil 这可以成立.当且仅当对所冇 j -^ o . 蚋数|_ / IL ." II 1 II 」是常数.因此，如果 li i !l 
就一定有 H 二1，十是，由 01. 6. 21) 可知.对所冇 A 6 M ,,. ||! A'|| 2 <U ■!,, ^ 
A i ； 因 | fi |. 对所有 AeAt . !| A :： = ：.4 j ,. 反过来，汕果两个诱异矩阵范数相同， 
则由（5.6.20)可知&,沢>^1,因而 ft (5.(3.2.1> 屮等式成立.由前面的证明得知，比值 

iML / IMI , 是常数. 「] 

5 - 6 - 25 推论设： IML 和 K , 是 CT 上的向域范数，乂设 : i • L 利 1 ;|| ‘ 忐示上的相应诱导 
矩阵范数.贝对所宥 A6M ■，成 立.当迀仅当 iAilL —! A 彳,对所冇 AGM ,, 成立. 

证明： 如果 | Af a dH 对所存， A 6 M , 成立，则冇 LW 为 （5. 6. 24)] 这蕴涵 
民/…二 1. 因此，根据 (5. G . 21). 对所有 AGW ,， ,： A；|„<ii A |y H ||!^ i|： f C 1 Ajj ； t . 口 

最后一个推论说明，没有一个诱导矩阵范数能够致地小于另 -- 个诱# 范数.如果允 i 午它 
问其他(不 -- 定是诱导的 > 矩阵范数相比较.会出现什么情形呢？ 

5.1 26 定 理设」 i | 是 M ,, 上给定的矩阵范数，且设 i | ， [ 是 M ., 上给定的诱导矩阵范数.则 
< a ) 存在 M ,, 上的诱 导矩阵范数』 V (•) 使得对每个 . 4 6 JH , 心 N (. 4X ||. A ，! j ; 
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(b) | A 彳<| A 二 对每个』成立. 3 R 仅坪 | A ||= ! A I 对每个 A eM„ 成立. 

证明： 定义 c" 上的 向量 范数 IH 为 

IM: = li X ；!. X 5 [.r .r … ： r] e M„, <5, 6.27) 

并认 考虑由 l|_l 诱导的 M, 上的矩阵范数 N(0. 对任意 A6M,. 有 

WA)= max = max ! L ^.^- Ax ],|| = ■ | ax | 

^ max ^^'11 = :| A I (因为 II: _ 彳是矩阵范数）， (S.fi. 2S) 

这就证明了 U). 为 f 址明 〔b), 假定 i „ 对所有成立.则由 （ a ) 可知，对所有 
AeM„ 有 

N ( A )^\ Aj ^ lA \. 

AJ 是 /V(. 〕 和.丨 • ||„都是诱导范数.所以由 （5 . S. 可知， /VCA)=|A 因而对所冇 AeM„ 

有 A 1=.ML. □ 

上述结果是促成给出下述定义的原 a. 

5.6,29 定义设|_||是 A1 上的矩阵范数，如果对所有 A&M,,, 适合 N(A)<.|| A 彳的 M,, 上的 
矩阵范数只有 N(-)=l! • ；|：,就称 ]• 1|是 M,, 上的級小矩阵范數. 

定理 (H26) 的论断 (h) 说明 . 的每个诱导范数是极小的.论断 （al 直接 推出每 个极小 
范数是诱导范数.因此，如果想采用一个矩阵范数，而它乂不能(用所有矩阵上的小值）一致地 
加以 改进. 耶么就可以采用诱导范数， Jf R. K 有这种极小性的任…范数一定是诱导范数. 

向窜 :范数 (5. G. 2D 是可由一个给定的矩阵范数构造出来的整个向童范数族的特殊 情形设 
III - II 是 m , 上给定的矩阵范数， jeer 是给定的非零向量，且用 

II J 'P.. ^lIU-v' j, ,V e C™, y 竽 0 ( 5 . 6 , 30 ) 

定义闲数 ILt'lL: c*^ r, 则 fH, 是 c’ 1 上的向 m 范数，且对所有 aeAi 具有性质 
II /U || v = I ) ： K；|| Ai| ； kv- ||j = |Mi|| jM| v . 

如果 1 … 1]、 则05』.30)簡化成(5.6.27).如果用 N y (.) 表示由 || • || v 诱导的 M,」|... 的 
矩阵范数，这个不等式说明，对所有 A6M,,， 有 

N ' (A)E=m ^ HW. (5-6.31) 

这显然是 （5. 6. 26a) 的推广. 

如果给定的矩阵范数 H 是极小 范数，则 （5. 6. 31) 说明‘对所有 AGM. jAjhN^A). 
W 为在上述论证中所采用的向量 .V 可以是任意非零向量，于是，对所有非零 _y ， 应有 
'U.). 

s. 6, 32定理设 || * I是 M„ 上的矩阵范数， AM.) 是用 31) 和 （5.6.30) 定义的诱导范数. 
则 F 列命题等价： 






218 


第 5 章 


(a) i|| • 1|是诱导矩阵范数. 

<bl I 是极小矩阵范数. 

(c) ；：■ K/V〆，） 对所有非零 y€C 成立. 

证明：（幻蕴涵 （t，） 的论断正是 （5. 6.261>).我们刚才已经看到，如果 I 是极小范数，则 
■I = 所以 （b) 蕴涵 u). 如果 (c) 成立，则 HI 是诱导范数，因为根据定义，~,(_)是 

诱导范数. □ 

从这些讼断还町得出一些结果.如果 ^(-)-1 - i 对所有非零成立，则 / v,o> 对所 
有非零 .V ， sec' 成立.但是推论 (5. 6. 23) 说明，除广差一个纯量因子以外，诱导一个给定的 
矩阵范数的向量是唯一确定的，所以，对某个正常数有卜|!、=〜 IH,. 

练习如果 M,, 上的矩阵范数:卜I是由 C" 上的向 量范数 II .11 诱导的， iiP 月，对所有 z 
ec ", 有」 〆，卜|| vihur\ ihi s = li-uii hi d 以及 〜=ibir'ii 向量范数|卜『如 
(5.4. 12) 中定义的那样.是向量范数 || • || 的对偶. 

S . 6. 33定理 设:|!_ __!是 M „ L 给定的矩阵范数，且设 ll.IL 是用（5.6.30>定义的（^上的向址范 
数.则下列两个论断 等价： 

(«) 对毎对非零向景 ^ ec\ 有正常数^使 iu Ik =「.,=■ II 对所有 .rec 成立. 

(上> !1 J . v ' Jr _ i iij- L 一 ^ 对所有心 y C u 且。尹 (1 成立， 

如果； 卜!| 是诱导矩阵范数，则它满足 tM: 等乂 （bK 且由它通过 （5. 6. 30) 构造的向董范数满 
足⑴- 

证明： 如果00成立，则 

^ ' ii : N • I - :i，Uklk — (i/G) IUIL = Ill'll, Nil, = I »!^' ；|- 

反过来，如果成立，则 （a) 成 R <, -! -rj"' "I 1 已经证明，如果』 V/Os) • 乜则 

U) [因而 （ b) 也]一定成立，而如果 HI 是诱导范数，则根据(5.6.32)，情况就是这样. 口 

练习我们知道，一个诱导范数的任一正 纯揸倍 数满足恒等式 （5. 6. 33b). 证明矩阵范数 
Mil 和1!*11 2 都满足这个恒等式.不过这网个范数都不是一个诱导范数的纯量倍数. 

在经看到.如果:是诱导范数，则||厂| = 1.遗憾的是，这个性质对矩阵范 
数 为诱# 范数的事实不是充分的.容 M 证明，函数 

M } (5. 6. 34) 

定义 J* 上的一个矩阵范数. Ji„ /!|i-l. 但是，因为 Hi A 八1, 对所有 .4 成立 ，且当 

A = [ ] □时， l!A i,<FA||, 所以!! .彳不 是极小范数，因而不可能是诱导范数. 

练习验证 (5.S.34) 定义了一个矩阵范数.更一般地，证明，如果 H (1 ,, ...||:.||L 是 
上给定的矩阵范数，则 1 

M . = max{l|'.4 1： j.A j, t , } 
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定义 r / w „ 上的一个矩阵范数. 

诱导范数在所有矩阵范数中是极小范数，但是，假定现在只考虑由酉不变矩阵范教组成的 
—类重要范数.这是一些对所有 Ae 風 和所有酉矩阵 U ， V 6 M „, 适合 A | h | L / AV ; i 的矩阵 
范数 HI . 可以证明，在这类范数中只有一个极小范数，那就是谱范数. 

5.6.35 推论 如果;是两不变矩阵范数，则所有 A € M „ 成立.谱范数 i _ ll z 
是 R 上仅有的既为诱导的又为酉不变的矩阵范数. 

证明：假定 I 1 是给定的酉不变矩阵范数 ， 由定理 （5. 5.26) 的 （ a ) 可知， W ( A >< i |_ A || 对所_ 
有成立，其中 N ( A ) 是由用 （5. S .27) 定义的向量范数 HI 诱导的范数，如果[/€财„是 
酉矩阵， MWI | ar | l =;|[/ X | h || Xih | UII , 因 IW 向量范数 j |* ll 是酉不变的.如果: r 6 C " 是 
给定的非零向量，则存在两矩阵 1 /使得 h 二 || 』|; 2 〜于是对所有^ t c " 有 || ,di = 

II P -r ll.L/V, || = || j- || 3 || LT*,, || = || || 2 || |. . 因时，向 fl 范数 |卜1 是 Eudid 范数的纯量 

倍, 而推沦 （ 5 . S .23) 说明， （用||，!|诱导的矩阵范数） W (_) 等于（用 H | 2 i 秀导的矩阵范数） 
ii - V 因此对所有有卜 |, 2 = a / u)<|a ii . 如果假定 Hi 是诱导范数，则它是极小的， 

M 而.||八|| 2 ='|九 || 对所有 .4 fM „ 成立. □ 

如果彳*_!是财„上的矩阵范数，利用 

| A | A ' || 

定义的函数 H •也是 M ,, 上的矩阵范数，直接计算说明，对所冇 AeiW „, |! .4 II ； = II /V |1,= 

II ^ 11= . ft I ' A lir = |) A * II , = |i A II ,, 但是，并非每个矩阵范数都有这个性质，这是因为 I All ; = 

|A ：|^!j A |,. 适合|_1|& 1 |卜 1 |的矩阵范数称为自伴的. Frobenius 矩阵范数和6矩阵范数是 
fi 伴的，又因为 

.! | = p{.\A 1 ) = p ( A ' A ) = |A 5：, 

所以谱范数也是自伴的.实际上，上的所有西不变范数都是自伴的[见 （7. 4) 节，习题 2]. 

谱范数可看作是仅有的自伴诱导矩阵范数. 

S . 6. 36定理 设: 1:是财„上给定的矩阵范数■则 
( a > IN L 是诱导菹数，当且仅当 H |_ 是诱导范数. 

( b ) 如果矩阵范数|_ !是由向 M 范数 ll . lt 诱导的，则 H :+ 是由对偶范数 ||•『诱导的. 

< C ) 谱范数是 M „ 上仅有的既为诱导的又为自伴的矩阵范数. 

证明：如果 〜（‘） 是矩阵范数，乂如果对所有 AeM „ 成立，则 
）= / V ( A _ )<|/\ |对所有 Aex 成立. to 果：， I 是极小矩阵范数， / V (‘），= H |, K 而 
N (_)=|._ ||1 ‘，所以 iH ' 是极小矩阵范数.由 （5. 6. 32) 可知论断 （ a ) 成立. 现在假定 |. .|| 是由向 
量范数 IH 诱导的.利用对偶性定理 (5.5. U )， 冇 

I A |||- = jA * I = max || AV || = max ( j | Az || fJ )° 

II ^ II = 1 1 i l| == 1 

^ max max j { Ax ) z \ ^ max max | | = max |i Az ||^, 


[309] 
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因 ifij ' H ‘是由 II •: ri 秀导的. 义于最 后-个 论断， 我们注意到，如果矩阵范数 hi 是由向 m 范 
数 11*11 诱导的， . nil *| l =! f • up , (1，)说明 I ! .，也是由 HP 诱导的.但是推论 (5.6.23) 说明，除丫 
差一个 if ■:纯量因子外，诱导一个给定的矩阵范数的向量范数是唯一确定的， 因而， 存在某个「>0 
使得 ii * r = n 于是，由 <5.4.] 6)，一定有 i 卜 li = m 仏 w 为给定 的向* 范数是 Lddi 范 
数的--个倍数，所以它们都诱异同一个矩阵蒗数，由此得出 □ 
练习证明，只要 h 是矩阵范数. |: _ r 就是矩阵范数. 

练习 给出一个例子.说明 ft 伴矩阵范数不一定是酉不变范数. 

在^ 5 )中引进的绝对向虽范数和单调向 M 范数是最通用的向量范数.用单调向范数诱 
异的矩阵范数有一个简单而乂有用的特征. 

5. 6. 37定理设卜 II是 C 上的向 M 范数. ，)_ II是由它诱导的上的矩阵范数，则下列命题 
等价： 

(a) HI 是绝对 范数； 即II M I卜11 .r II对所有 .rfC 成立. 

<b) iH 是单调范数；即只要I 糾 < ly I ，就有 || _v II . 

“■) 如果 D 二 disgCiA . A , …，则 

: jj D , = max I tA |. 

证明 ■■ (aPKb; 等价足 （ 5 .5. 川彡的内容.如果|卜|1是单调范数，乂如果令 
d = max I d , 丨， J = I A I - 

则 I D.r I < I 心 i , 因而 Dxli 1 | T || , & = q 时等式成立，于是 


因而 （b) 蕴涵 （d. 如果假定 （ c ) 成立，设 .r. J.ec 是给定的， s , \ A ' \ yi , 注意到存在 
「3]j)| -组复数 A 使得 I -f* I = d t y k ,且 I 1 ；r. 因此，如果 D=diag(,rf 1 , 

dJ , 则冇 D 厂卜；和因为 

IM -J- ! ll - il Dv |J < ^ D || || ^ I ： =£； |b |l , 

所以范数 iH —定是单调的. □ 

习题 

L . 试给一个关于矩阵的向讀范数的例子，它适合||门|<】. 

2. 满足斤 A 的矩阵/\称的为幂等的.试给一个不同于 J 和0的 2 X 2 幂等矩阵的例子. 
证明0和】是幂等矩阵仅有的特征值.证明幂等矩阵 A . -定可对角化，乂如果 A # 0 , 则 i | IA || 
為〗对任何矩阵范数成立. 

3-如果 Hi 是 Ai 上的矩阵范数，证明.对所有是矩阵范数.但是证明，对 
任意 ，- <1, ^,11- V 和 HI HI , 都不是矩阵范数. ’ 

4 . ft 定义 (5 . 5 ._0 中，间一种向量范数有两种不同的【十算方式.更…般地，可以定义 II. ^为 

^ max^ I, Ar |[, 




向 f 范教和矩萍范教 


221 


凡中 ll *: L 和 Hl _, 是两个（可 能不问 的）向量范数.这样的幽数|| 是矩阵范数吗？试研究一 

ri *" u , 确定它可能具冇那些冇趣的 性质： 注意.这个概念可用来定义关于矩阵的范 
数.这 是闪为 : l_i Qf 以取 c " 上的向 域范数.而 M , 可以取 c 上的向量范数.在这个意义 
r. ''：• 有哪些性质咭诱导矩阵范数是一样的？ 

5. 证明 Euclid 范数和谱范数 | • I 卩都是 M ,, 上的两不变 范数； 也就是说， H 要 LT 和 V 
都是两矩阵，4与就有相间的范数.试就你能考虑到的各个方面，对矩阵范数 | 卜 IU 与 
卜 ,|, 作 -- 比较.注意 M 二 | u A’.41 1 L '. 

6- 证明关干 • ，..的公理（1)〜（3)对（5,6.7)屮的||* },同样成立.这证明了，如果在 
( S . S . 7) 的假设和结论中用“关于矩阵的向量范数”代替“矩阵范数”，〔5.6. 7) 仍然成立. 

7 .如果 i |;. i 是 M „ 上的诱导矩阡范数. 乂加果 S '6 M „ 是非夺异矩阵，证明[如 （5. S . 7) 中定 
义的 ]I • !|也是诱导矩阵范数.如果1 . i 是由向 a 范数 II . |!诱诤的， iiF 明矩阵范数彳 . 乜是 l 如_ 
(5.3.2)中定义的]向最范数.|叫|、 1 i 秀异的. 

证明 M „ 的节奇异矩阵汴 A 九巾是稠 密的： 即证明中的每个矩阵是诸非奇异矩阵的 
极限，奇诗矩阵也有 M ,, 中稠密吗？ 

3. 旺明，对所存由 C " 上的 | i 〗 M 范数组成的集合是凸集， 但是， 对任意由 
M „ h 的矩阵范数组成的集合 不是卩 h 集.证明.二+丄/ V :(.)] 是矩阵范数，当 R 
仅当对所有 A , BeM „ 有 

- / V ,( A ) J [ N 1 ( B ) - N . CB )] - N ,( A ^)] 

+ 2 [ N ,( A ) N L ,( B ) -- |. 

提示 ：考虑 NJ.)= II.L 从（.） Il_||” A=-< g 及 B = A r . 艾丁-矩阵范数集的一个虽 
要子 集是凸 集的事丈见例 （ 7 .1. 54). 


10. ili : 明， AT „ 卜的/,范数 M I 1 , = [ 是矩阵范数，但不是诱导范数. 

11. 证明 F 述各个恒等忒都是计算谱范数 (5. 6. S ) 的等价 形式： 


二 max | y ' Ai I 二 max j y ^ Ai j . 

• r ■ - 1 ' I , ^ i 

" : •- I 

利用这些 恒等忒 证明 !| a b - IA ' :,对所有 A e M „ 成立‘然后利用是矩阵范数和 / TA 是 
Hcnniu ; 矩阵的事实证明 I A / V | 2 A ' Aj |,-!| A 

12. 如果 〆 A )< J , AeM „. 证明级数 HA + f I - …收敛 T 和（卜. A ). 

13. 如果 AtM „ 不是可逆矩阵，证明对每个矩阵范数 H 冇 |J —A :>1. 

设 HL 和 H ;1 ■是匕给定的矩阵范数.证明 | A | y 是 ai 上的矩 
阵范数.什么时候它是诱导范数？ 


晒 
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15. 试给一个矩阵 A 的例子，使得 〆 A || 对每个矩阵范数|_，|||成立. 

16. 设[〜] £ JVt . 证明，用 | 定义的 M „ 上的函数 H | 是矩阵范数， 

而当时，它不是诱导范数. ' 

17- 利用习题12的想法汁算矩阵 


Lo 0 1 


的逆. 提示： 在级数中只有 H 项非零. 

is. 说明如何推广习题 n 中的方法求一般非竒异上三角矩阵 AeAl 的逆. 提示： 选一个 
对角矩阵/>，便得 da 的主对角线上都是 1. 

]S. i 正明，谱半径〆_)是^,,上的连续齐次函数，但是它既不是 M,, 上矩阵范数，也不是 
M„ 上的向量范数，这是因为， 

(a) 可能对某个 At ^O， 有〆 A)=0; 

(b) 可能有〆 A + 月 

即使〆都是非零的，也可能有〆 

板考虑[::] ，[::] ，□和 [: :]. ^ 

20. 证明 I.! AB K||A 1| 2 | 則：和 || |! 2 < 1| ,4 ||“ 4对所有 A, S6M„ 成立. 

21. 证明 MltklAi _! A L 对所有 成立 . 提示： ^(A* A)< ; || A-A'i , 且 ||{|, 

=il A !l 、 . 

22 . 设 II， IL 是 C" 上给定的向量范数，定义 II. |!〃 = ( ||.||j rj 为对偶范数.设 H1 和 H 
分别表承由 li_IL 和 l|*IU 诱导的 M„ 上的矩阵范数.利用 （5. 6. 3(5) 证明， j||A*| = | 对所有 
AfM„ 成立.证明 | A 呢 <|AyiA 儿对所有 A6M,, 成立，并且说明是怎样推广了习题21中 
的结果.这个不等式与 ^ = 3- 时的 (5. 4. 13) 有何关系？ 

2S. 验证，下表巾的各值给出的诸最佳常数使得 [ |八 || |。<(：„|力1对所有必6加„成立. 
表中的所有范数都是矩阵范数.表下面的提示（<， j) 与表中确定的（，，元相配.每种情形都 
gli 1 铪出 r— 个矩阵，对这个矩阵，不等式 I A£<C„ ! a ^ 对常数的给定值是等式. 
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下列矩阵都是中的矩阵： 

J 是单位 矩阵； 

J 是所有元素都趋1的 矩阵； 

A, 是其第1列的所有元素都是1而其余元素都是零的 矩阵； 

A: 是其 （1, 1>元是1,而其余元素都是零的矩阵. 
n, e ) 根据 （ g . 6.2i), 可从 （2, 1) 得到. 

(1， 3) liAj'fii II ； A,. 

(1, 4) Ai， 

(1 ， S) max [J [ a, I]' < S[2 i I]" < [iUE U 2 ]， 

l ^ r, r-l ; = 1 r=t J = i 

(Cauchy-Schwarz 不等式）； A]. 

(1，6) max 2 I 1^ n max \ a t} | j J - 

Ji-i jt-. »r j _ ^ 1 I n 

(2, 1) 从(2, 5) 和 d 1> 可得； A: 

(2, 3) 从 （2, 5) 和 （5, 3) 可得； 

(2, 4) 从 (2, 5) 和 （5, 4) 可得； 

(2,「)） |f A I ^jo(A^A) ^ A) = tr = || A ||h A 卜 

r -= L 

(2, 6) 从 （2, 5) 和 （5, 6) 可得； J. 

(3,1) 根据 (5.6.21), 从 （1, 3) 可得； A；. 

(3, 2) 根据 （5.6,21) t 从 (2, 3) 可得； . 

(3, 4) 

(3, 5) 类似于 (1, 5); A；. 

(3, S) 类似于（]， 6); J . _ 

( 4 - 1 ) 22 \ a ； K « max 2 I I ! 

^ = 1 i=] I 

(4, 2) 从 (4, 5) 和 （5, 2) 可得； 下述矩阵用两种方式给出等式：取注意 

『I 

=«〃，几当_/乒0时^]/ =0而 y = o 时它等于设 A 的(々， y) 元是/并且验证， A，A = 

*=« 

”1， i|A|| i； II A 1=：^ 和 || A \\ t = n . 

(4, 3) 类似于 (4, 1); I . 

(4,5) [2 |] ; = S u, iu„ |<| 2 [U, n， 

(算术-儿何平均值不等式 h J, 

(4，2 I a t , rt 2 max I a y | f J , 

L ,jr=] rf 
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(5， 1) 2 X ) ; a --> '■ A i 「公 . 〜 S "[max 公 U n I ] E ; J . 

i ~\ ，-] ; I ' I _l ••广 H r •] 

(.). 2) X ； ! a, p - tr A- A - 2 Ar(A' A) 夂 "uAM); /. 

(5，31 类似丁 .(5，1); 1 . 

(m $ U, I. 、 [ 它 I Ih I]、Ah 

(3， G ) U £ i,j r < rr max , u„ ' : ; J. 

fr j- 1 ]■ r.J」r 

(6.1> max \ a b |< max^J \ a (} | ； /- 

( ft ，2) max I a. : J ^ max V | tj r , P - rnaxLA. A\ ^_p(A r A) i I t 

i r, 〆 I •• J- v j j I • j- t 

(6, 3) 类似 f ( fi ，1 )* /. ■ 

d - l ) tnax J a , K ^ i c(jJ | ； A ,. 

Im! ' V w ] 

( fi , 5) max I u„ \- < V j ( j. r I "； A ... 

1 " J, -- ，.厂 I 

24 ‘ 证明习题 U 屮界 （5, 2) 可改进为 || A IkClnink A] l M .4 || 2 . 提示 ： ran kA = A -/\ 的 
[ HI 非零特 征值的个数. 

25. 设 A € M „ 是给定的矩阵 . 由引理 （ 5. S . 1 U ) 可知，存在某个矩阵范数 I .] 使得 〆 /!^- 
.;/ V |< yA > U . 证明存在非竒矩阵 m ) eM , j 使得 (oMXjCAC ' I ^ AJ + e . 提示：利 
用与引理 (5.6. 10> 屮相同的构造法，丼 M . 证明， ^ e *0 时 :!（ V\C f 二^ / TA ) 十 0( e ). 

26-证明， || A ||彳^ | AJ J 对所有 H 成立，其中等式成立，当且仅当 A 是正规矩 
阵. W 为这 t 理由，数值 ， 


[IIAIH-S iA, | ? ] ：； 

/■■] 

fl ■时称为正规性亏损值..提示 ：利用 Srhur 二角化 定理和 Frobenins 范数是酉不变范数的 車实. 

27,利用定理 6. 9) 和友矩阵可以给出实系数或复系数多项式零点的界.讧意 — 个次数 
电少是1的多项艽 ./ U 可以马成的形式， tt 屮 r 是非零 常数， 

P ( ~ } - ^ t 1 I a „ -, z " - + … +〜《■ 十如 (5. fi . 38) 

的根是./( ; )二0的非零根， tfli 对十这®根，我们吋以给出各种界. （ a) 证 

明，友矩阵 


Vip) 



(5. 6. 39) 
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的特征多项式正好是 〆 Hifu (：’(/>) 的特征值与 〆 0 = 0的根相同.提示：汁算 d «[ 2 / — 
V ( p ) 1时用其第]列的代数余子式和归纳法. （W 利用定理 (5. B . 9) 证明，若 z 是 p (=) = 0 的根 
川'、 1 是紙 上的任一矩阵故数，则，^必 （'( p)IL 如下 . 2 表=0的任一根.（。> 利 
用 U 证明 


I z K max I | a „ | ,1 - r | (j i , **■. 1 +! «„ , I } 

< 1 4 max{ I a., ! , I -a, |，•■■. | “„ j }. 


(5.6.40) 


这个关于根的界称为 Ou^hy 界. （ d ) 利用 II . * I 证明 

)« I ^ max *! 1, I u M H I * ]-f … +| a "., I } <； 1 + | a „ I [ 1 tj , |+ … +1 tj „ ! 1. 


这个界称为 Montd 界.证明它比（: auchy 界要粗糙. （ e ) 利用|| • IL 证明 
I : | < (V. 1) +1 fj" -I | fi : I f "• +1 U„ ! I . 
对十所有》>2,这个界比 （ d ) 中的界祖糙. < f > 利用彳 证明 

卜 I si [« I I «, I 2 +-| «,卜|-… I I tj „ I I "] 1 : ( 
这个界比 rarmichael 和 Mason 界 （5. 6. 42) 粗糙. （ g ) 利用 n ||.| i . 证明 

I ~ In niax《1 . : a, I , [ a[ [ a„ , | ■、 

它比 (5. fi , in 中的界粗糙. 




28. 利用习题 27 中相 同的 妃号，我们町以改进其中 （ f ) 项中的界.把 友矩阵 写成 C (户 h-S 
f /?, 其巾 


而 



_ i “ - a„ ■, … -a, — a„ 

,、 0 0 … 0 0 

R . : ... 

0 0 … 0 0 J 

然后 i ■正明 S . RH 0 . 旺明 I S ' S ||. L> --1 ftlil I U , i L， - \ a , + 

证明 

! 「 (/>) 卩 = “»-( ： :( 々）；； = ](S + R)U.S + R) 
叫 I .s's+fdi < I s'sjj, 十 广 

由此推诤 I_li Carmichael 和 Mason 界 

( i I^Cl — U I 2 叫屮 ! ; + -+ U „ ! I 2 ] 1 ， 2 
29- 把界 (5. 6. 41) 应用到多项式 




(5.6.42) 
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(z-l)p(z) 

=+- (a„.-i — 1 )j" + (a„ ■■ 一 )«『 1 + ■■- + (a„ — >2 + a 0 , 

然后证明 

I « I max{ 1 ， I tiu | 卞 | u。 — a, I 十 … + | a,^t — a„ ； | + | ti,「] — 1 | }. 

证明这个表示式的第 2 项不少于 1, 并 ii 推导出 Motud 的另一 个界： 

:^ I ^ ! tin +1 a., - A I -h •" +1 — h I -f I — 1 | (5. S. 43) 

30. 试用 Montel 界 （5. S.43) 证明 Kakeya 定理：若 /(«)=£；〆+£；„ …十〜 2+% 是 

一个给定的多项式，其系数〜均为非负实数且在… 的意义下是单调的， 

则 /U)=0 的所有根都在单位圆盘内，即 | i 1 <1. 

31. 前面四个习题给出的都是关于 pU)=0 的根的绝对值的上界，其实也可以得到它们的 
下界.证明，若〆幻是由 （5.S.3S) 给出的叫#0的多项式，则函数 

q(~) 丄 =>(丄）= 〆+ 訌广 1 + … 卜 | 丄 

^'■1 ' = . “u Cin £J(] do 

是--个次数为《的多项式，而它的各个根正好是 />U)=0 的各个根的倒数.试用^4=0的根 
的各相应上界得到 />u) = 0 的根 z 的下述下界. 

Cauchy ： 

I ； |> .. 丨〜I __ 

max{ 1- | a H-J i I , ! ci(, \M cl, s t I ，…， 丨 a" | + | ai 丨 } 

> _ I a, I _____ 

〆 I ^ I 4 max{ 1 ， I a, j | , I 2 i ，…. | a, | } ■ 

Montel : 

I ； ： >__L^ lJ __ 

I Ul -i-1 U\ 1 + 1 H - +1 I 「 

-> j _ I n ；> I 

/ 1 +| a ,」+ | Ul |+ "+ 十 k .] I 

Carmichael 和 Mason： 

I ^ i> _ ____ i … I___ 

[i+l ^ p-h … F + . u + Uh i 2 ] 1 ” 

3 2. 当把习题 3 1 中的 F 界与习题 27 〜 30 中的上界结合起来时，就有可能把〆 d 的根确定 

在-个环域 U: | ^ | 例如，考虑 

/U) = ^' + 十…十 十 ^ +1， 

它是指数函数#的幂级数的 n 次部分和.证明 /(w 二0的所有根 S 满足不等式 

I « 1 + «!■ 

把 Kakeya 定理应用于 f/(l/z), 试证明所有这些根实际上满足不等式丨 i | >1. 

31因为对任何非奇异矩阵 D 有 pM) , 把习题2 7 中所采用的方法应用到 

DK 力) D 可以得到 （5. S. 38) 中的多项式 pU) 的根的其他界.为了计算方便，我们选取 0 = 
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diag P 丄 3. 所有 A >0, 然后把 Cauchy 界 （5,6. 40>推广到 

I ^ | ^* | aj | 4- \ ^ j ~~ 4 - ， 

1 Pi Pn Pl Pr> ~ 1 ,r ,,,, 

(5. 44) 

I a v ~2 I 合十， ， I CVl | + ^1, 

Pl Pi P 2 I 

它对任何正参数 h ， 外，…，九都成立. 

34. 如果 (5. S .38) 中的所有系数 w 都不为零，选取 I , ^2, 3 ,…， L 
试从 （5. 6. 14) 推导出/)心)的根 s 的 Kojima 界， 

i l < maxj | a , 1 , £ | | , 2 | J | , .... 2 | | j . (5. 6. 45) 

35. 现在对某个 >^>0, 选取九三 〆 ，^ = 1, 2, n , 并且证明，对任意 r >0, C 5.6.44) 
蕴涵界 


I - K max { | a „ | 广]’ ！…| 广? + r _ f ，丨〜丨 〆 + r _1 ，…， 
I i r 十 〆， | a^ x i+ r 1 } 

< 丄 f max \ \ at \ r w "^ ] u 

r w . j 


(5,6.46) 


36. 如果 / V & M , 证明 Hermhe 矩阵 i 

^ r o ai 

()> 吣 „ 

与 A 有相同的谱范数 ( H | 2 ). 提示：我们知道. -- 般地有 

37. 如果 A . B 6 M „. -4 是非奇异矩阵， S 是奇异矩阵，乂如果 || . | 是仟意矩阵范数，通 

明 jA - Bj 5 il/:|U ' J . 提示 ： B = A -( A ~ li )- A [ I--A '(A — B )」 是奇异矩阵，所以 II , A 】 （A 
- 在中它的几何意义是什么？如何用一个奇异矩阵去充分通近-个非纾异矩阵？ 

又于这个问题的进一步 ij 论见 （7. 4. 1 ). 

进一步阁读 习题23的表中的各个界取自 "p 述文章 t!. J. Stone, **Hest Possible Rario.s of 
Certain Matrix Norms, 4(1962), 114-1 16, 它还给出 j " 另外一些界和参考 

文献.有关用矩阵范数确定（习题27〜35中）多项式的根的其他#考文献以及进一步的讨论可 
参看 M. Fujii and J*. Kubo. Opera!or Norms as Bounds for Roots of Algebraic Equationsi " 
Proc.UpanAi-ad. 49(1973), S 05 -808. 冇 关确定[定理 ( 5 . 6 . IS ) 中] 诱 4 范数间的界的问题的 
更 — 般 讨论可 见 下文： H‘ Schneider and W. G. Strang, “Comparison Theorems for Si]premum 
Norms , ''Nitm^riirhe Math . U 1962), )5-20. 在 「 Wip ] 中 i.f 论了极小矩阵范数. 

5.7 关于矩阵的向量范数 


关于向量范数的所有公理虽然对于矩阵“大小”这一有用概念是必需的，何是，对于某些重 
要的应用来说，其中的矩阵范数的次乘件公理 （4) 不是必不可少的.例如.非常有用的极限 
f'H 10实际上对比向缺范数更 -- 般的函数类仍成立，闹不只限于矩阵范数‘为此，在这里着 
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|| .4 II 5 max \ a „ | . (5. 7‘ 7) 

/+:(3.6)节中已经知 m . HI . 是 t 的向 i 范数而不是矩阵范数，不过是矩阵 
范数. ■ 

L 述儿个例子足以说明. M ,, 确实有许多向景范数不是矩阵范数.此外，在这些范数屮. 
冇些同时艮有从次乘性得来的某些矩阵范数性质，有些则不具有.佴是，从灿„上的每个向量 
范数等价于忏一矩阵范数（在它们有相 N 的收敛序列的意义下）；亨实一个更为一般的结粜 
可」1:接由定理 (5. 4.4) 得到. 

S .7. S {定理设/是财„上的准 范数. 即 M „ [：正定、齐次和连续的实偯函数，另外设 是 
M „ 上给定的矩阵范数.则存扑有限正常数 C ',,, 和 （',, ,使得 

C ,„ ( S . 7. 9) 

对所冇成立，特別是当/(…是初,,上的向量范数时，这两个不等式成立， 

如果把有关矩阵范数的结论推广到关 T 矩阵的向量范数或更一般地推广到关于矩阵的准向 
M 范数. 不等式 （5. 7 . 9} 是很有用的.例如.极限 (5. G . ]4)就可以在这个意义下推广. 

S .7.1 U 推论如果/是上的准范数，则对所冇 A 6 M ,,, limL / GV )」 1 * 存在， 钍对 所有 A 

ew ,,, 卜' 

limCM/l 1 )] 1 二 〆 A). 

特别是，/(*)是灿„上的向量范数时，这个极限成立. 

证明： 设 M 是 M „ 上的矩阵范数，考虑不等式 

(■；, lA ( || </(AM !|, 

它蕴涵 

(Wf W/V)]“ W 

其中 々 ： k 2. 3, +... 但 是，当 々-* …时， —]. ( v — 1和 nWr — pM )， 所以我们得 
知， ! i . m 「/( AM 」 u 存在且等 〒 y ( A ). □ 

在另一种意义 F ， JW „ 上的仟一个向 H 范数都等价尹 t 矩阵范数.这在前面的例5中已 
举例作丫说明.可以用常数因子〃修改向量范数|1.|!使它成矩阵范数.这种情况不是偶然的： 
每个向范数都可以这样修改. 


S . 7. 11定理对于!:每个向鼋范数 G (_). 存在有限正常数 KC ；), 使得 ( ((,) G (.) 是 M „ 上 
的矩阵范数-如果 Hi 是 M ,, 上的矩阵范数，乂如果对所有/^蚪,有 

⑷- (5. 7. Ua) 


则 


此外.存在一个矩阵范数，使得关十的这个上界是可以达到的，所以 
<( G ) = j 是知:阵范数 U (5 . 7. ]1«)成立 I . 
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证明： 对任意 r>0, 函数 l|*||=f G(*) 可能不满足次乘性公理，但它满足矩阵范数的所有 
其他公理.此外，很容易从 G (_) 的连续性和 G (_) 的单位球的紧性推导出 
* [ ( G ) = max ■ = max G ( AB ) 

UiAJOirS) (AA) = l=(i{tJl 

是有限正数.于是，对所有 A , BGM „ ( 

G ( AB ) < KG ) G ( A ) G ( B ) 和 c ( G ) G ( AB ) < Kr ,) G ( A)r ( GJG ( B ) 

假定 H | l 是上的矩阵范数，且假定给出了 GO) 与 |* I 间的不等式.于是 
G(AB)<C m kAB ||<C m iA ；|： ||B 

[323: 因而 


KG ) < 鈇. 

如果我们特别选取矩范阵数 I ， |W(G)G(‘）， 则 C.„ = KG), a C m = l/ £ (G), 所以 C„/G = 

r ((;). f ] 

练习证明，如果点则是矩阵范数.特别地，证明 （; M G (,)/ t ： i 总是矩阵 
范数. 

练习试直接由 （5. 7. 11) 推导出 （5. 7. 1⑴中的冇关向量范数的结果. 

矩阵范数次乘 性的- 个推论是下述事实：相应于 M „ 上的毎种矩阵 范数， 都有 C " 上的某 
t 相容向 ft 范数.次乘性的刃一个推论是，对毎个矩阵范数|||.!||有||!3||>^-4); M „± 的向量 
范数 (40 如果对所有 AfM „ 存,||.4 ||5^( A )， 就称它为谱优势的.有趣的是 M „ 上的 有些向 
范数在 C 上有相容向 M 范数，而有些则没有.那些在 C " 上没有相容的向量范数的广义范数当 
屮，有些是谱优势的， ifri 有些则不是.于是，上的向量范数在 cr t 可能有相容的向量范 
数，而它乂不是矩阵范数. 

5.7.12 定义 C N 上的向量范数||.1|称为与 A 1 上的向量范数是相容的，指的是对 所有/ 
ec " 和所有冇 


II Aril < G ( A ) II X II . 

有时采用术语协和的，时冇时称向 M 范数 11.11 从属于广义矩阵范数 G (. h 在前一节[例如. 
( 5 . 6 . 27) ， （ s . 6 . sen 」 中，已经述及了这些概念.在这里要特別论述儿个有关的结果. 

5. 7 .13定理 如果上的矩阵范数，则在 C 11 上存在某个与它相容的向量范数. 

证明： 如果我们定义 IM 吨， 0 0…0],||，那么 II Aj II =|| L 九 "0 … 0 ]|=|LCr 0…0]!|;< 
ill A ! jjo 0 … 0j !|^ ! | A||j II II , 口 

我们已经知道了它的逆命题‘定理( 5 . 6 . 2 )说明，如果 H 是 c " 上给定的向量范数，则存 
在与它相容的矩阵范数[诱导范数 (5. S .1)」. 

练习试说明由（5.7」 3) 确保的 C " 上的相容向量范数不一定唯实际上， || ^- ]| = 
國 … j ]|| 也是可行的， 闲为对 任意非零向量 3^ C " 有 m =：|^^||1 
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5.7.14 定理设 (7(0 是 iW „ _ h 的向量范数，且在 C ’’ i : 有相容向最范数|卜|| . 则 (7( A )；^( A ) 
对所冇 A & M ,, 成立.更•般地， 

G ( A ,) G ( A 2 )- G ( A *) 彡 〆 A 】 A 2 " v \ 5 ) (5. 7. 15) 

对所有 A , A :, ….和所有6=1， 2, …成立. 

证明： 假定 i = 2, 且设 iGC " 是适合 A 4 2 . x = k 的非零向暈，其中丨 A | =^ A , A e ) .则 
^(A, Aj) || .<■ |i = || ii- || = |i A, A 2 j ： !| 

=|| |! < G ( A ,) || A ,.,- It ^ GfA ,) G ( A ,) j | x |!. 

因为 II . H ; 另 o , 由此得出类似地用归纳法可以证明一般情形. n 

什么时候似„上给定的向 ft 范数在 C " 上有相容的向 fi 范数呢？条件 （5. 7. 15>是必 要的： 
为了 E 明它也是允分条件，需要一个技巧性引理. 

5.7.16 引理设 G (*) 是 M „ 上适合(「).7. 15) 的向量范数，乂设 . H l2 表示上的谱范数.则 
存在有限正常数 c — 使得 

CC . A ^ GtA . i - GM *} > r ；| A , A Z - A , ll , 

对所冇 A , ， A : , …，和所有 i 二1，2,…成立. 

证明：根据推论 （ S . 1.5)，存在有限1常 数办」 6( G )， 使得对所有 A 6 M , 成 
立.是给定的正整数， 且设心 ，土， +•+, 山 6 M „ 是给定的矩阵. 根据舒 异值分解定理 
(7.3.5), 有两矩阵 V ， W 以及对角矩阵 2 = dia g ( a , , 内 ，…，〜），其巾.所有使得 
A 1 A ,- A t - V 2' W * fq (0 (2) = m ax {, Jl , 5„}=|| A , 八;… A , 根据 （5.7. 15)，冇 

G(V ) G ( A , ) G ( A 2 ) … (;( A *) f ;( W )> p { VA , A 2 …土妬） 

^ p ( 2 ) 

-Ul 

■- IV ' A . A .- A . Wl , 

后-个等式成立是 w 为谱范数是两不变的.因而得出， 

G(A, )G(A t )-.( ； (A,)> G(y , l )Q(W> ,j| A.A,-^, I > |： 2 

= b 2 I : AA … A * 

如果取引理的结论就证明 /. □ 

S . 7 . n 定理设 G (_) 是 / W „ 上的向 M 范数.则存在 C " 上的向量范数 II .11 使得 
It Ar || < G(A) (| x |l 

对所冇 ^ ecr 和所有 A 6 M ,, 成立，当且仅当 

(;(A t )G(A 2 ) r - m C(Ai) ^ piA^A。 … A*) 

对所有 A ， A ” …，6 和所有是=1, 2，…成立. 

证明： 必要性已在定理 （5. 7.4) 中证明.义丁充分性，需要证明，存在上的矩阵范数 
: lhK ^# G ( A )>| Apg ^4 AeR 成立.设|!，||是 c " h 与 I . ||相容的向量范数[定理 
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(5.7. 13) 保证它存在]，且设 x 6 C " 和 Af M , 是给定的.因此.如果能构造出以 G (*) 为优势 
范数的矩阵范数，就证明了 M_r |i <| A !| i | x || < t ；( A ) i | x li . 

对于给定的矩阵 AfM ,,， 有无数多种方式把 .4 表示成若干个矩阵的乘积或若千个矩阵的 
乘积之和.定义 

1| A,||^inf{2^<A, 1 )-G(A lt ) : …=八，且所有,\ e M„). 

如果 SA ,,__+ A \= A ， 则根据引理 (5. 7 . 16) 和关于谱范数的三角不等式，有 

)■*•(；( A ir ) 2 f ill A , -- A ^ I = < i|A | 2 . 

由这个不等式可推出，所构造的函数 H : 是正定的. M | 的齐次性可直接从 g (*) 的齐次性得 
_ 出.关干卜|的二角不等式和次乘性可由它作为乘积之和的下确界的定义得出. □ 

练可详细证明，上述定理中所构造的函数 ill _ _彳满足三角不等式， Fi 有次乘性质. 提示： 
如果 C=A + B 或 C = Aii , 则（分别)作为乘积之和的 A 与£的每个表示式给出（：作为乘积之 
和的表示式，但是，并非 C 的所有这些表水式都以这种形式出现. 

练习考虑 M 2 上的向量范数 (5. 7. 5>，假如它在 C z 上有相容向量范数|卜|| ,则可证明 

^ PHI [:: BK :]隠， 

" IBhir ； mi- [::]II[:]1^ 

它蕴涵 

1[:] K :M; : 遞]||， 

因而 

试证明这是不能成立的，由此可知 M s 上的向量范数 G (.) 在丄不可能有相容向量范数. 

练习（续）即使上的向 M 范数 (5. L 5) 在 C : 上没有任何相容向量范数，也可证明它是 
谱优势的.试根据定理 (5. 7. 17) 进行讨论. 

现在，知道了关于上的向量范数在 C " 上有相容向量范数的有用的必要充分条件.同 
时也知道，只要在 C " 上有一个向量范数，则 透导矩 阵范数 （ S . 6.1) 就是与它相容的上的次 
乘性向景范数.那么，什么时候 C " 上的向 M 范数在 M , 上有非次乘性的相容向虽范数呢？这 
样的范数总是冇的. 

5.7.18 定理设 HI 是 C " 上给定的向量范数.则在 M „ 上存在不是矩阵范数的向量范数 
_ GC -), 使得 


II ^ || ^G(A) || j- [| 
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对所有的 . r 6 C ' 和 AeM „ 成立. 

证明： 设尸6财„是具有零主对角线的任一置换矩阵，例如， P-LP,,!， 其中，如果 J = 
Z + 1, 或! _= fi 且 j = 1,则 h = l ; 否则. p.i = 设 il _ .!|表示上由向量范数 II _ II [通过 
(5.6. 1)] 诱导的矩姶阵数.在上定义 G (‘） 为 

G(A>^ ； !A||! + I| P|| : |P T i!i max U, |. 

显然， G (*) 是 M , 上的向量范数， G ( A )>| 名|对所有八6财„成立，且 
j | Ar II S ； I A i| II .r II < (；{ A ) lull 
对所有 A 6 M „ 和 所有工 ec " 成立.但是， 

G (PP^) = G(Z) = || ： /' ： +!|P! ； !|p J -i|| = i + ：|pJ ||P T !|| 
cm = !|.p|i 
G(P r ) - ! ： p 7 I 

G ( IT r ) > G ( P ) G ( P r ). 

因此，対„上的范数与 C ' 上给定的向量范数 I 卜 || 相容，而它不是次乘性范数. □ 

练习设考虑极大行和矩阵范数的下述 变更： 

ill A (I ； = II' A + diaK(a„ . 叱 ,—a m ) : |! y ,, 

证明这是形如 （5. 7.2) 的 Hadamard 乘积范数，因而它是 A 1 上的向量范数.证明这个范数与 
CT 上的向董范数 HU 相容.然 后汁算 

lie :1 和 i[: :]1 


并且证明这个范数不是次乘性范数. 

习题 

1. 设 G (_) 是 M ,, 上的向量范数，是给定的非零向量.证明函数 

luil 

是 C " 上的向量范数.当 

y = [1，1，…，1] ; 或 ; y = [1 ，0，()，•.. ，0 ] J 

时，这个范数是什么？ 

2. 设 HI 是 At 上的仟意向 tt 范数， SAGM ,, 是给定的矩阵， a E >0 是给定的数.证明 
存在某个 K = K ( e , A )>0, 使得 

|[ || ^[ p ( A )+ e ]* 

对所有 k > K 成立. 

3. 设 INI 是兒„上的任意向 M 范数，且设 A 6 JW „ 是给定的矩阵. （ a > 利用习题2证明，如 

果 〆 A ><1, 则当 o 时 | AMI —0. 它以什么速度收敛？ （ b ) 反过来，如果当 co 时 
II ||—0，证明 〆 A )<1_ 提示： 如果且 x ^ O ， 考虑 || ■… j ，] || . ( c ) 关于利用 

向童范数讨论矩阵幂级数的收敛性，你能说些什么？ 

4. 设 （;<•) 是 K 上.给定的向量范数.巨定义函数 ( T : 为 
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G’(B) = max CA BA). 

证明以（_)总是上的矩阵范数.证明总有以（〖）= 1.如果 G (7) = l ， 证明 G \ B )> 
G ( B ) 对所冇 BeM „ 成立. 

以 卜四 个习题是习题4的延伸. 

5. 如果 G (_) 是 M ,, 上 的矩阵范数，证明 〆 （ B )4 G ( B ) 对所有成立，并 K 证明，如 
采 G (7) = l , 则 G '(*)= G (*). 

6. 证明总冇 （/( diG ' h ). 

7. 如果 G (_) 是 M „ 上的向 M 范数，且 GU ) = 1,证明 G (*) 是矩阵 范数， 当且仅当 

対所有 BeM „ 成立. 

8. 证明，在习题4中定义 &(_) 时.可以颠倒 A 与 S 出现的顺序，从而得到另一个矩阵 
范数.用例子说明，这另一个范数不一定等于 

9. iiE 明与 M „ 上 •个给 定的向量范数相容的 C " 上的所有向量 ^ 范数组成的集合是凸集一 
实际上它是一个锥. 

10. 说明数值半径/ ■(•} 不是 M ,」 上的矩阵范数.试考察 (5. 7. 4) 中的各矩阵且比较 r ( AB ) 
与 r ( A ) r ( B ). 

11. 定理 C 5.6.!)) 中的不等式 I A ;|> P ( A ) 可以由关于矩阵范数 || • ||1 的次乘件公理 （4) 得出. 
但是，可能有这种情形， M „ 上的一个向量范数满足这个不等式（即它是谱优势 的）， 而它不是 
矩阵范数.证明 r (/\) 彡 〆 A ) 对每个 A 6 M , 成立.更- •般地 ，证明 WA ) 匚彳 〆 AnV = l }. 

12. 证明上的向量范数|| * | L 在 （ T 上不可能有任何相容的量范数. 提示： 考虑 
_ ilJ ,, IU 和 〆 九）. 但是，证明 MM .. 是 M ,, 上的矩阵范数， W 而它弁: C " 上有相容向量范数. 

13. 设 A 的第；行的转置用 h (△> = [〜， m …. a „] T 表示， tWA 的 

第 j 列用 MA ) = [叫，％，…， a ,„ J 7 表小.义假定1|‘|1„和1!，^分别是 C " 和 C " ■上的向景范 
数， 然后，定义('、，■ 为 

G ,. AA ) = I ； [ II 。⑷ IL，M r “.4) L，".， II r ,„ C -4) II , J 1 II ,. 

类似地，定义 GHw — R 为 

G —( A )= II [|| n ( A ) II ,, || r 2 ( A ) II ,,-, | k ,,( A ) II ,] 1 L . 

证明，化,„(‘）和&〃（_>各为似_上的向量范数，但不一定相同.注意这是在 
矩阵空间上定义向童范数的 fi 然方式. 

14- 试比较习题13中的6^(_)与（5.(5)节习题4中定义的范数 I . :匕，并且用例子说明， 
即使爪=；!(且 ||*| L 二 Hi ,), (&(•) 也不一定是 m „ 上的矩阵范数. 

15. 在习题13巾，当 HL = ||，|| ? = H 3 时， G ^( •) 是什么范数？ GO (.) 是什么 范数？ 

16. 在习题 13 中，当 HL = H , 且 INI , - ll . IL 时， &.„(•) 是什么范数？是什么 
范数？汔./…与^^^有什么关系^ 

17. 若上的向1范数，定义 G (*) 的谱示性数为 

m ( G ) = max p ( A ) 

UAX Z \ 
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证明， G (.) 是谱优势的当且仅当然后址明， M ,, 上的任一向量范数在乘上一个常数 
[其中最小常数一定是^(0)]后可以变成一个谱优势范数.如果 = 则称 M „ 上的范数 
G (0 为极小谱优势的. 

18. 证明，任何诱导矩阵范数是习题17中所定义的极小谱优势范数.说明有一些范数是 
极小谱优势范数但不是诱导范数.证明数值半径 KA ) 是极小谱优势的. 

19. 证明谱示性数是由 M ,, 上的向量范数组成的锥上的凸函数 t Rlflj 证明上的所冇谱 
优势向 M 范数组成的集合是凸集. 

20. 证明，上的向量范数 G (*) 是谱优势的，当且仅当对每个 A 6 M „ 存在一个常数^ 
[只与 G (_) 和 A 有关]，使得对所有整数1>0,有 

G ( A y ) < r , G ( A )*. 

21. ( a ) 证明，当 A 是正规矩阵时，数值半径 H *) 适合/ ■ U )= (0 ( A )=|| A 〗 2 ,但是…般 
r ( A )^| A |. 给出一个关于矩阵的例子使得 r ( A )< i | A ||,. 提示： 证明当是两 
矩阵时 r ( L /+ At /) = KA ), 然后利用 A 可酉对角化的事实.再说明一般地有 

rCA ) = max | / At max |l .4 x ||. || ||, = || A j ||,. 

II r li„ -• 1 II r ||- = l " 

( b ) 证明，对所有 A 6 M ,, 都有 r ( A ) = KI ). ( c ) 按如下所述证明对所有都有 :||A 
2 r ( A ): 记 


^ = (A-A 1 )/2+ CA-A* )/2 ~A, +A,, 

并注意到 A 和烏是正规矩阵.然后证明 

I ^ | z <:|Aj .1? 十 .| A 2 || 2 = r(A,) 十 r(A:X r(A)~hr(A k } - Zr ( A ). 

( ci ) 试考察适当的矩阵.如 G □和匕 JJ , 说明 U ) 和 （ c ) 中给出的界 

- i|h|| 2 ^r(A)^|||A!j, (i) 


是可以达到的. 

22. 试用习题 21(d) 中的不等式以及定理 (5.7. 11>中给出的关子的界证明，函数4「(*) 

是 M,, 上的矩阵 范数. 试考察,4=1^ i_ |，A' 和 ZiA ‘，证明 <:(r)=4+ 

Lo oJ 

23. 由习题 21(d) 中的 U) 以及 (5. 6) 节习题23给出的不等式， 

—II A [| 2 < ||| A || 2 ^ || A ||, (ii) 

试推出，对所有的/\61\1,不等式 

II ^ Irs ^ r(A) ^ || A || 2 (iii) 


成立，并且证明其上界是可以达到的.验证 


A-[° ^和分別给出了 （ i) 和 （H) 的卩界中 
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等式成立的例子，然后验证 U 是 ( i ) 和 ( ii ) 的上界中等式成立的例子.由此说明，为什 

_ 么 （ iH ) 中的 上界是 可以达到的，而 ( u ) 中的下界不一定能达到.为什么对所有的 AeM „ 存在一 
个有限正常数使得 I 1 AKHA )? 实际上， n 为偶数时 G = (2«)_ 12 , 而 n 为奇数时 G = 

(2« —1) 对于 偶数〜 相等的情形要求矩阵酉相似于形如 KA )= j 的诸矩阵的 直和； 

当 n 为奇数时，矩阵的直和一定要附加一个 | 1 | 的被加单项 [ a ]， 且 | a | = KA ). 

24. ffi 明 [ A , S ： Nt r •定义 M „ 上的一个内积，而财„上的/ 2 范数可由 [. , .] 导出； 

即|1力|| 2 =[力， A ： P 对所有 A 6 JW ,」 成立.证明，如果 X = 是秩 } Hermite 矩阵，则 
II 11^1^. 证明给定的矩阵的值域正好是 A 到范数为1的秩1只打0^ 6 矩阵的集 

合(关于内积 [• ， * ]) 的射影组成的集合， JT ■且证明 r ( A )= m a x ( j [ A , X ] | : X 是秩1 
Hermite 矩阵月. |1 X II ； }. 利用 Cauchy-Schwarz 不等式证明 r ( A )< || A || j , 

25. 数值半径与自然逼近问题有联系.设是给定的，并 R 假定我们想在最小.二乘 
方的意义下用个秩为1的 Hermhe 矩荜的纯量倍去尽可能地逼近 A . 如果记 X = 

C， II j - II --1, 试证明，当 「=[ A ，■?■?’] 且其中的单位向 ft 可使 （5. 7. 6) 中的极大值达到 
时，则 

II A-X 11^ = II A-cr.r' IIS > II A y - 2 [A,^-] l + UI 2 

可以达到极小.由此断定，如果对所有纯 r 以及所有具有 || X || 2 = 1 的秩1 Hermite 矩阵， 

II A-.X ||,可以达到极小，则 | r | = r (^). 

26. 前面两个习题引出了数值半径和值域的一个自然推广.设是一个非空的矩阵 

集合，且适合以下 条件： ' 

u ) 若 xe 扎则 对所有 a ec 有 - 

( b ) 对所有 xe 少有 [ A , X ] = tr AX -=0 当 R 仅当 A = 0； 

( c ) ® 是一个闭集 ■ 

若 AeR ， 定义 

^( A ) ^ max I [/ i.Xl | =■ max | tr AX * | • 

II ^ ! u - i ii \ l , f -1 

说明 A ■) 是有意义的，它是 m „ 上的向量范数， ii 满足丨 ma ) I < ii a i | t . 证明 对每个 a e 
m„ 都存在某个 x. 4 e® 使得 ii x.4 ih=i 且奴 /\)= I [ 九 x A ] I. 
mu 考虑用 ® 中的矩阵去逼近给定的矩阵即求某个 xe 少，使得 II A— X || ; 达到极 
小.证明，矩阵 AAiXa 给出了一个最佳逼近，其中 | [ A , X A ] j ,并且用任意 
逼近/\的误差有最大下界||/1 II ?- i [ A , X A J l ^ o . 

证明，若$是由秩1 Hermite 矩阵的所有纯量倍组成的集合，则趴 a ) = KA ). 在®是酉 
矩阵的所有纯量倍的集合的情形将在例 (7. 4. 6) 中讨论；在这种情形下 MA ) 是 A 的各奇异值的 
平均值‘另一个值得注意的情形是 < P 是所有竒异矩阵的集合，这将在例 （7. 4.1) 中讨论，在这 
种情形下以4)是 A 的最小奇异值.还有一个值得注意的情形是，秩是已知的正定矩阵、 
Hermite 矩阵或正规矩阵的所有纯量倍的集合，或者是由酉相似于一个给定的矩阵的所有矩阵 
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的所有 纯置倍 组成的集合.在上述每一种情形，与值域类似的是集合 i [: A， X] = X &$}. 

27. 即使数值半径 KA) 不是矩阵范数，但对所有 m = 2,…和所有它的确满 

足幂不等式 r(A"X[r(A)]% 试按以下步骤证明这个结论. 

Ca ) 说明只要证明下述结论就足够 r ; 若「(々)<1，则对所有 m = l ， 2,…有 r ( A ™)< l . 
设是给定的正整数，转到余下的论证，设(沈,：1 = &^" 1 }： 1 - 1 表示，《次单位裉的集合， 
注意到 { u '*} 是一个有限乘法群，并且对毎个_/ = 1, 2 ，…， m 有 = { W t }； T=i . 

(b) 说明 


1 — z'" — JJ (1 — -W k z ), 

然后证明，对所有 ^ec 有 


p ( z ) = isn (I ■— U -' iz ) 
rn ) = \ ^-1 

提示： 注意到〆幻是次数至多为 m —]的多项 ii, 且 

1 JL T … m 
p(z) ^ — 2 


对所有 Z6C 都有 p ( z ) = p (- w , ： 
<c) 证明 


• WjZ 

-- piw ^ z ) ,因而 / »U> 二常数=/>(0)- 


/ —A ， "=Hui,A ) 和 / = 丄云 ； fj ； (fi*A). 

+ = J 771 ; 1 A-i 

( d ) 设 /ec 是任一单位向 t , [| x ii 3 = i , 乂设 /\ eM „. ^ 证 

1 — ^'d~A"')x = ax>'(I n. 

J ( 卜叫叫 *[ 立 (’- 一 )1] 

1 m wt 

^ - S z i [u — wywj ，^ s jj (；- Wi A ； j - 

V 

( e ) 现在在 （ d ) 的恒等式中用 〆 A 代替便得到对任意实数没有 

】一，應=士 | 口卜、 ( 祝 ^)]. 

然后 假定/ 证明这个恒等式右边的实部对任意是非负的，由此推出左边的 
实部对所有也一定是非负的.由丁 0是任意的，证明这蕴涵 | | <1,因而 r ( A ” 

O . 

28. 即使数值半径满足幂不等式但它对不等式不 
总成立.试通过考察 AsJJOiUXiJonlan 块矩阵 ）， 々=1和„,二2来验证这一事实.提示： 
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利用算术几何平均值不等式证明， KA 2 ) = KA 3 ) = | ， 然后用 Cauchy-Schwarz 不等式证明 
KAX1. 

29. 类似于极小矩阵范数概念 (5.6.29) ，试问在上存在义于 “ 极小向量范数”的合理概 
念吗？ 

进一 步阅读 关于涉及数值 -t 径的不等式的进一步讨论可参看 M. Goldberg and 
E. Tadmor, “On the Numerical Radius and Its Applications, Alg, Appi. 42(1982 )， 
263-284. 匀题 27 中关于数值半径的幂 + 等式的证明取 n C. Pearcy, “An Elementary Proof of 
the Power Inequality for the Numerical Radius, Math . J . 13( 1966), Z89-291 . 本节 
某些内容是本书作希的研究成果，可参看 〔 :. R. Johnson, ^Multiplicativity and Compatibility of 
Generalized Matrix Morms，，’ Linear AppL 16 C 1977 ), 25-37, “ [xxwlly Cotnpatihle 

[334] Generalised Matrix Norms ， ” Math* 27(1977) ， 391-394，“Power Inequalities and 
Spectral Doininaiue of Generalized Matrix Nurms, ,J L/>^tir AppL 23(1979), 117-130 , 其 
中还有其他的结果 . 

5.8 矩阵的逆和线性方程组的解的误差 


作为矩阵范数和向量范数的应用，我们来佔汁在求矩阵的逆和求线性方程组的解的过程巾 
所引起的误差. 

如果给定了非奇异矩阵可以设想能够准确地计算出逆矩阵 A 、但是，如果计 
算是在数宇计算机上用有限长的计算机宇符来完成.则不可避免地要出现舍人误差和舍位误 
差.另外，即使能十分准确地完成所有计算，但可能有这种情形，矩阵 A 的冇些元素是某些 
实验的结果或某些必然会出现误差的计算结果，因此，就不可能十分精确地知道这些结果.那 
么，汁算巾的误差和数据中的误差如何影响要计算的逆矩阵呢？ 

对于许多普通的算法.可以证明，在计算中的舍人误差可以用同一种方式模拟成数据中的 
误差.也就是说，如果假定 A6M,, 是给定的非奇异矩阵，并且想计算 A — 1 , 而实际计算的可 
能是 （A+EK、 其中 E&M,, 是足够小的矩阵，且使 A + E 为可逆矩阵.于是，误差是 /T 1 一 
(A t_E) + A 'E) 'A 如果 pCUX], 则 A + E 就是可逆矩阵，且我们可以 

把 （J+AD — 1 写成 A 'E 的幂级数，这就给出 

A' 1 -(A + E)- 1 - A" 1 — 2(—1)*(4 = 2(—l)* n (A \ 

因此.关于这个误差的精确 公式 ：“ i_ ' 

A 1 - (A I E)- 1 = 2(—lrUA - WA - 1 ， 如果 〆 .4 'E) <1. (5.8.1) 

k= \ 

现在假定 || H 是给定的矩阵范数，且假定闪而特别有 P (A ' EX 1 ffl (5.8 .n 
成立.于是 

llA - 1 - (A + E) 1 j |= | g ( l )*' 1 (A I 
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-<§11，"11"=—爲1”1， 

由此得出，求逆过程屮所引起的相对误差的一个上界屋 

|A W ) 11 < 占爲.如傘1 E 1| < 1. (5.8.2) 

只外， 如果 it E 足够“小”， WSlII/fll-O/lAl, 削〆 A 7;)<||A 丄 E|<||A *：： !：£-|<l. 
且有估计式 

I £)--|| ,. |A-i|| 丨闵| — I 1 A.|(| E|/! A I) 


III A 


数 


|A T | E ||| — 1 II 4-' ||! | AJ |(|| E .；|/ U |||)' 
如果 A 是非奇异 矩阵； 


fM - II MU ' 

k (A) = < ' (5. S . 3) 

U -| 如果 A 是奇异矩阵 、 

称为 # 阵逆关于矩阵范数 ill • 的奈件数.注意 a A > HI a 1 j ill A j >| A - 1 AI 二 j 〖 1 对任意矩 
阵范数都成立. 

利用这个记§，有估计式 


~~ [ A - ||! "- 」< 1 — ^ AKl ' EVrA ]) “ 如果 i E ]l I A_, il < 1 ， (5 - 8 ' 4) 
它用数据的相对误差表示矩阵逆的相对误差的界.对 小的: 右边为数量级以 A )|£|||/|| Ai |, 
所以有充足的理由相信，只要 / c (^) 不很大，矩阵逆的相对误差与数据的相对误差就为同一个 
数 tt 级，为了求逆的际需要，如果 〆 A ) 较大，称 A (关十矩阵范数 II _ I )为病态的或坏条件 
的；如果 《( A ) 较小(接近十 1), 就称 A (关于矩阵范数|，彳|)为良 态的； 如采 k ( A ) — U 就称 A 
(关于范数卜|)为优态的. 

在采用的范数是谱范数的普通情形，条件数有一个有趣的几何特征.设扒 A ) 表 j 当 x 和 
取遍 所有正 交单位向量偶时向量 Ai 与间的最小角.利用谱范数，^)=^1^(^)/2]. 
因此， 若 A 是酉矩阵， 则沢 4)^/2 11.«^(71/4) = 1=«(八).若 A “近乎奇异矩阵”，则有某个 
止交单位向量偶^ y , 使得‘儿乎平行”于 A . y , ( KA ) 就会很小. 而以 A ) = cot [扒 A )/2] 就 
会很大.欲知详情， * 参看例 （7.4. 2 fS >. 

练习证明，如果 AeAf fl 可逆，则 WAhdA — 1 ). t 

练习证明，如果 U , V 6 M „ 是酉矩阵，且采用谱范数（或者任何其他两不变范数），则 
f c ( A )= K CUA )= / c ( AV )= l c ( UAV ). 因此，一个给定矩阵的两变换不会使它比原有的性态更加 
病态.这个论断为许多稳定数值线性代数算法奠定了華础. 

练习证明总有 «( * ) 是 M „ 上的矩阵范数或向量范 数吗？ 

利用上述这些条件 N 样可以对线性方程组解的精确性给出先验的界.假定希望解方程组 
Ar —■ b , A M„ , b ^ C" (5. 8. 5) 

似是，因为计算上的误差或数据不精确，实际上是解方程组 
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國 


(A + E ) ^ = A , A,E e M „, A £ C ". (5.8.6) 

关于误差广- h 可以说些什么呢？ 

如果£足够“小”，使得 〆 A —' EXl ， 则根据 t 5. 8.1) 有 

,r-}= A 'b-(A + E) '/>- [A 1 - (A + E ) 丄]* 

=&(-1) 川 (A-DVV 'b = 2(-l， n CA l E) k x. 

•t = l k ■■- 1 

如果 IHI 是矩阵范数，且又如果 HI 是相容向量范数，则关于误差的范数的上 
界是 


IU-i|| 'Ef II -HI 


IA 'E,[| 


II 工 II . 


关于相对误差，这说明，如果 ||a 'EilKu 且II_II是与矩阵范数 H! 相容的矩阵范数，则 






: A-^HI 


(5.8.7) 


Ik II ^ 1-U l Ef 

值得注意的是，这与关于矩阵逆的相对误差的上界 （5. 8.2) 是相同的，且与线性方程组的右边 
ft 无关. 

利用 A 的条件数，用来推导(5.8. 4 )的证明同样可以证明，如采 |!A 1|£|<1,且向量范 

数 HI 与矩阵范数II ■ 1 相容.则 （S. 8. 5) 的解的相对误差有界 




< 


«(A) 


III 


(5. 8. 8) 


U || ^ l- K (A)(||E||/liA|) 'jjA|||- 

无论采用什么算法来解线性方程组 fi. S) ,它的解的相对误差与其系数矩阵的逆的相对误差 
有相同的界. 

像标准线性方程组 (5. 8. 5) 的系数矩阵 A 的兀素一样，它的右边的元素也可能产生误差， 
影响方程组的解，于是想用 


(A 十 £) i = i> + (? (5. 8. 9) 

代替 (5. 8. 6), 其巾和 eGC 看成是“小”的数据误差. 

采用相同的方法，在关于 （5.8.8) 的相同假设下，（如果6弇 0) 求得 （5.8.5) 的解与 （5.8.9) 
的解之间的相对误差为 

II < k ( A ) | ^ | , «(A) || g || m s Tn 、 

II ill ^l-«(A)(!|E i ||/|Aji) i || A |「1 -“ A) (I E ||I/|A II;) || 6 || ( 5 .& I0) 

这样，相对误差界有两项，一项是关于系数矩阵 A 的相对误差界，一项是关于右边6的相对误 
差界.在确定关于解误差的界对数据误差的界的灵敏度方面，条件数仍然起着决定性的 
作用. 


至此，我们的所有估计式都有一个先验的误 差界； 它们不涉及所计算出的解或者由它导出 
的任何量.但是，假定通过计算已经求出方程组 （5. 8. 5) 的某个“解” 1恰好有 Ai = 6 的情形 
往往是不可能的，不过，可以从剩 余向量 r=d > —得到 i 与真解 x 如何接近的估计式.因为 
A_V=A '[_ b - Ai^A = 所以有简明的界 |1 <|| A—V ||. 如果 I .I 是与 
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向量范数 IH 相容的矩阵范数，则我们有 II 6 II = II Aril <|| A || IUII ， 或者当6^0时， 

|| iA !| IMI / IUII ，因而 

"d < !| A 1 Ml < Ld | J ^|| iA -,||| || r || = I A 11 A "' 

因此，如果枯 0, 计算出的 K 适合 — r ) 与真解 x ( 适合 Ar = 6) 间的相对误差有界 

^Ixf 11 G ⑷ 1 ^ 1 ， ( 5 . 8 . U ) 

其中，假定用来计算条件数 《( A ) 的矩阵范数是与向量范数|卜 || 相容的.对于良态问题，解的 
相对误差不会比剰余向量的相对大小(更)坏；对于病态问题，即使计算出的解产生一个小的剩 
余向量，它仍然可能与真解相差很大. 

关于误差的范数估计的最后一个注释，我们指出，本节所导出的各个上界仅仅是上界而 
已.尽管上界可能很大，但是实际误差仍然可能很小.这些界的一个共同特征是它们的保守 
性：它们给出的误差界对许多问题未免太笼统了.但是，如果一个有适当阶数的矩阵 A 具有 
适当大小的各元索，且有较大的条件数，则 A 1 —定有某些大元素，于是，对下述理由多加考 
虑是有益的. 

如果 Ar = fc , 且令 C =[ q ] 占 A \那么，关于元~ 微分 恒等式2=0便得恒等式 

音二 c' y ， i，j = U2, … (5* 8. 12) 

另外，把匸二义^看成 A 的函数，则它的各元只是 A 的各元的有理函数，因而可微.恒等 
式 CA = J 表明，对所有 i t 9 = 1 ，…，〜有 




因而 


自[1>.士 [畜 |>]+仏 


在 〆 、， i,j,k — 1, — t ； 

现在关于~微分恒等式 i = 使得 


它是恒等式 ' ^ 

■f™ =_ c <i (5.8.13) 

因此， （5. 8. 12) 和 （5. 8. 13) 同时提醒我们，如果 CsA — 1 有相对大的任意元素，则解 I 的 
某个元素对 i 和 A 的某些元素的扰动就可能有难以避免的较大灵敏度. 
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习题 


1. 证明非奇异正规矩阵的逆关于谱范数的条件数是 

/KA) - p(A)p(A *) =| UAVUA) I. 

2. 求矩阵 

、 - 二] ’ £> 。 

'的特征值和逆矩阵.证明，当 £—0 时，的最大特征值与最小特征值之比为数量级 e 试用 
习题1证明，关于谱范数有 KA) 二 ( Xe 证明，关于任意范数有 k (A) = 0( £ 1 ),因而对于 
求逆来说， A 是病态的.试用 A 1 的显示形式证明，对仟何范数有 HA)=0( e -M. 

3. 求矩阵 


厂1 - 1 1 

^Li - 1+ }>。 

的特征值和逆矩阵.证明，当 s -*0 时， B 的最大特征值与最小特征值之比为数量级 L 但是证 
明，关干 tt 何矩阵范数有 1 ) ，闽而当 e —0 时，对于求逆来说， B 是病态的.由此 
可知，最大模特征值与 fi 小模特征值之 比不一 定是非正规矩阵的条件数. 

4. 矩阵逆的条件数 〆 A ) 依赖于所采用的矩阵范数，但是可以证明，所有条件数在下述意 

义下是等 价的： 如粜以 AbllA 'I |A '| o , |1,,，则存仵有正常数和(：:,„使 

得 

对所有 A 6 R 成立. 

5. i £ 明.关于谱范数，每个酉矩阵 U 对于求逆是优态的 [ K ([/) = l ]. 位是，如果采用 
范数，每个 W 矩阵的条件数<^[7)是& 

e - 证明，对任意非奇异矩阵 AeM , 和任意矩阵范数有 U ( A )|_/ U ( A ) U , 
( max 和 m in 在这种情形是指特征值的极大模和极小 模). 因此，如果这个特征值的比是大的， 
则该矩阵对于求逆 -- 定是病态的，而不管它是否为止规矩阵.但是习题 3 说明，如果矩阵不是 
_ 正规阵，即使这个比不大，它仍可能是病态的. 

7 - 试对界 （5.8.8) 的推广 （ r >.8. 〗0)给出详细证明，当 e = 0 时，界 （5.8.10) 就简化成 
(5. 8. 8). 

S . 设：是 C " 中的单位向童，且设 A >0, 证明 + ■是 Hermite 矩阵，且有 （《 —1) 
革:特征值1和特征值 1+ A . 证明. k (/ U 二 1-1 K 关于谱范数），于是，这给出了产生可逆矩阵 
的简单方法，且使该矩阵具有有界元素和 ft 意大的条件数.为 什么？ 

9. 设 B 是习题3中的矩阵，考虑具有精确解7 =「1’ 0] r 的线性方程组 = iy 及其 
近似解 j = [l +£■ 1 % e 1 -] 1 .证明，当£一0时；剩余向 fl 的相对误差为 || r " || / || |i - 

0;但是，当 e .*0 时，解的相对误差为 II i — ill /|| ill oo . 这样，有大 

误差的近似解可以产生小的剩余向 tf . 试用界 (5. 8. 11) 来说明. 

10. 如果 dot A 是小的 〈或大 的）， K ( A > 就一定大吗？提示： 考虑 A =_ UeM „. 
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11. 一般， （5. S .4) 的结果比 （5.8.2) 的要昶，这是因为假设 条件 』 A 1 ! jEllCl 比 UlA—m 
<1 有更强的限制.不过，即使较强的假设条件被满足. （5. 8. 2) 仍然可以给出比 （5. 8. 4) 较好 
的上界.试用 E = £ j 4, 0< £ <1,作出说明. 

12. 如 果方程 （5. 8. 5) 和 （5. 8. 6) 用 

AX - B 和 （A + E ) 又 ■ - B 

来代替，其中， A , Ee / W n , 而入，求关于界 (5.8. 7) 和 (5. S .8) 的类似界. 考想 k ， 

„和 B = 1 的特殊 情形； 这有助于“说明”为什么 （5. 8. 2) 中 >5(5. 8. 7) 中的卜.界是相同的码？ 

13. 我们已经导川的矩阵逆的误差的各个界都依赖于 （ 5.H.1), 它要求 〆 A ' EXl .证 
明，如果 A 和 A + E 都是可逆矩阵，则不论 A fE 的阶数如何， 

：| A" 1 (y\ + E )~' l| <l| A' 1 i||(A + £) 1 ；| j E|| ! 

对任何矩阵范数 卜 I 都成立. 提示： 证明 A ; (A + K ) ]二(.4十幻 'FA 

U . 或许被引用得最多的病态矩阵的例子是用 / i v = l /(; + j —1) 定义的 Hilbert 矩阵 H ,, = 

[心] 6 M ,,. 证明关于谱范数的条件数是用， A m „/ A ,„ m 给出的.其事实是的条件数是_ 
渐近地等于，，其中常数 (大 约是 3. 5,另一个串 实是当 %时 〆 ff „) = TC + OLl ,'( l 0 g »)]. 

我们有 〜 5 X 10、 K ( H S )〜1.5 X 10 7 和 〆 H «)〜1.5 X 10 lLI , 说明，即使 n N 的各元都. 

致有界不是很大，为什么 H ,, 还是坏条件的. 

15. 如果采用谱范数，证明 w ( A + A )= dAA " ) = Lk ( A )] 2 . 试说明，为什么采用数值方法 

解 A ' At -3- 的问题可能不会比解 At 的问题真正来得容易. 

16. 设是非奇异矩阵.试用 (5. 6) 节37题屮的不等式证明 ^( A )>|||4 |/| A — 召|对 
任一夺异矩阵成立.这里||卜 | 是仟一矩阵范数，而《(*)是相应的条件数.这个下界坷 
以用来证明一个给定矩阵 A 是病态的. 

17-设 A 二是所有的上角矩阵，试用习题 ] 6 证明 关于极大行和范数的 
条件数有下界 


min | a tl 

进一 步阅读 仵解线性方程组时求误差的先验界的问题已是数值线性代数的一个中心问 
题； 见 [ Ste ]. 


画 
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6.0 导引 


对角矩阵的特征值是很容易确定的，并且矩阵的特征值是其诸元素的连续函数，干是，我 
们自然要问，如果矩阵的非对角元相对干主对角元是“小”的，那么，关于它的特征值，我们是 
否能够说出任何有用的结果来.这样的矩阵的确在实际中 出现； 由数值离散化椭圆型偏微分方 
程的边值问题得来的大线性方程组就可能具有这种形式. 

在某些涉及一个振动系统的长期稳定性的微分方程问题中，人们感兴趣的往往是要证明一 
个矩阵的所有特征值都位于左半平面内，即 ReCUCO . 而在统计学或数值分析中，人们有时 
需要证明 Hermite 矩阵是正定的，即所有 A ,>0. 

有时我们想在一个容易刻化的有界集上估计一个矩阵的特征值.我们知道，矩阵 A 的所 
有特征值都位干复平面上中心在原点，半径为 I:A |的圆 盘巾，其中 Hi 是任意矩阵范数.然而， 
能否用更准确的估计区域做出比这更好的估计，使得该区域肯定包含或不包含这些特征 值呢？ 
我们将会看到，这是能够做到的. 

最后，假定确实知道 A 的各特征值，乂假定 A 必然会产生扰动 A+A + E . 这时.特征值 
如何变化呢？因为4的特征值是4的各元的连续函数，所以有理由相信，如果扰动矩阵£有 
-- 个足够小的变化，则特征值不会有太大的变化.但是需要有准确的界限，以便知道在每种情 
形下怎样小才是所谓的“小”.这里的基本问题与 （5. 8) 传中相同，在那里，我们讨论/线性方 
程组的解对数据扰动的灵敏度. ， 

6. 1 Gersgorin 圆盘 

如果 AGM „， 总可以把 A 写成 A + 其中 ， D = diag(tin , >正好是 A 的主对 

角部分，而 B 存零主对角线.如果对任意 £& C ， 令 A , 三则 Au = D ， 而 Ai = A . A 0 = 
D 的恃征值是容易确 定的： 它们恰好是复平面中的点 ail 我们有理由推测，如果 c 
足够小，则4的特征值将位于点“ u ，…，的某些小的邻域中. 卜述 定理(常称为 Ge^gorm 
圆盘定理)使这个论断更为明确：确实存在某些以点〜为中心的容易计算的圆盘，它们肯定包 
含诸特征值. 

6, 1. 1 定理 （ GerSgorin ) 设 乂设 

K'-(.A) = 2 W,j I * 1 < ; < « 

J，] 

表示 A 的各去心绝对行和.则 A 的所有‘征值都位干„个圆盘的并 

0 e C ： | * \^.R ： (A) <6.1.2) 

.• 1 

巾.此外，如果这 《 个岡盘中有 a 个之并形成一个连通 区域， a 它与所有余下的„ - a 个岡盘 





246 


第 S 章 


都不相交，则在这个区域中恰好有 A 的 A 个特征值. 

证明：设 A 是 A 的特征值，托假定 Ai = Ax ，_t = [ a ]，0. 工 有一个元素具有最大的绝对 
值，例如.刈所有△…， "， I 心 I ^ I - r , I . 且心# 0. 十是 Ai — A _ r 的假定说明 

A 心一 [ A . r ]^ — 「 Ai~! p = ^ t ay , ， 

它等价于 u 

」3 _it jc p {X — a ^) = ft 〆 j 

尸丄 

另一方面，-.角不等式使我们得出， ! P 

Uj> I U — 〜 1= < 2 i h 土 I O I A I 

I ) = \ I i M r - 1 

j-^-P P 

<| 心 I 土 UX，、I 私. 

;=] 

闲而，对某个 p, I A-a„ I KK ： 即; l 位于巾心为七 m f- 径为 < 的闭圖盘中.因为不知道 
哪个 P 适合每个特征值; U 除非知道相应的特征向量，要是这样，我们就准确地知道了 A, 况且 
可能对确定 A 不感兴趣），所以只能 得出. A 位丁所有这些圆盘的并中，它就是区域 (6. 1.2). 
为了证明定理的第二个论断，记八= 0十右，其中 D^diag (〜 ，…， 且今 + 
注意， R ： U ,)= R ， AeB )= e R ： U ). 为方便起见，假定前 A 个圆盘 

U 恤 e C:| n |<i?： 1 

r - 1 

形成连通 g 域 d ， 且它与佘下的”一办个圆盘组成的补区域 G ; 不相交，即 Gi = G ( A ) .值 
得指川的是，对所有 eG [0, 1]， A t 的前々个圆盘的并 

G t ( e ) izeC --\ z - a , , -^ RUA ,) = e /?:( A )} 

] 

包含在连通集 G*=G*(]) 中，不过，对所有这样的 G ( (e) 可能本身不是连通集.另外，补区 
域(^( £ )=(?上）\(^( £ )中没有一个与(^相交.对于每个 hi, …， A*, 考虑特征值 
A 以及 A,(A S )，e>0 .因为特征值是 A 诸元的连续函数(见附录 D>， 又因为对所有 e e[0, 1] 都有 
A,(A t )eG 1 (e)CG t , 所以每个 A,(A。） 通过 G* 中由 a(A t ) : 0< e <l} 给出的连续曲线与某个 A, 
C/0=A,(A) 相连结.对于毎个 e6[0, 1], 得知，在 f;*U) 中至 少包含 A f 的4个特征值.但 
是， G*G) 中 A, 的特征值乂不会多于々个，这是因为， A„ 的其佘 n — { 个特征值作为一些连续 
曲线的起点落在连通集以外，而其终点肯定在补区域 Q 内； 因为连续性和连通性（这是叉 
于连续函数的中间值定理），它们不可能跳越 G 与&之间的空隙. r 

(G- 1.2) 中的区域常常称为 A 的（关 f 行的） GerSgorin 区域； A) 中的各个圆盘称 
[M 5] 为 （ hrSgorin 圆盘，且这些圆盘的边界称为 GerSgonn 圆.因为 A 和 A 1 有相同的特征 g ，为 
/得到用去心绝对列和 
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描述的且包含 A 的各特征值的区域.可以把 GerSgorin 圆盘 定理应用于 A ( , 得到关于列的 
Gersgorin 圆盘定理. 

6 . 1.3 推论如果则 A 的所有特征值都位于 „ 个圆盘的并 

[J {z e C : I n,, i< C / ,)=G(A r ) (6. 1.4) 

厂1 

屮.此外，如果这些圆盘中的*个之并形成一个连通区域，且与所有其余《 — 4个圆盘不相交， 
则存:这个区域内恰好有 A 的々个特征值. 

练习 证明， A 的所有特征值都位于区域 （5. 1.2) 和 （6. 1.4) 的交中，也就是说，它们位于 
G(A)HG(A T ) 中.试用具有的 3 X 3 矩阵来说明. 

闶为 A 的所有特征值都位于 1. 2)和 （6 . 1. 4 )这两个区域中，所以 A 的最大模特征值也 
在其中.在 G(y\) 的第：个岡盘中，离原点最远的点有模 

I | + _R: = 丨 a 丨， 

因而这些值的最大者一定是 A 的最大模特征值的一个上界.当然，类似的论述也可对绝对列 
和作出. 

6.L 5 推论如果 A 则 

p(A) < min{max2] \ I . max^] \ a„ | }. 

J J-I J r [ 

这个结论是我们意料之中的，因为它是说， p(A)<| A I,, fPjj A r 大绝对行和范数和 

极大绝对列和范数），且这个不等式对任意矩阵范数成! i. 但是， 有趣的是，这个结论冇一个 
本质的几何推论. 

因为只要 S 是可逆矩阵， S 与 A 就有相同的特征值，所以可以把理应用 
于 S 'AS； 也许对 S 的某个选择，所得到的界可能更准确.一个特别方便的选择是 = 
diag(/i lt p z . pj, 其中所有久 >0. 容易算出， D- , AD = lp, Ull /p,_\. 把 GerSgorin 定理 
应用于 D ’AD 和它的转置便得到下面的推论. 

6 . 1-6 推论 g A=[«,JeM n , H. 设 A ，声 . …，/>„是正 实数. 则 A 的所有特征值位于区域 

0 卜 f c : | S.-U,, K ★ 名 /N i O 卜 (;(i) 'AD) 

中，同时也位于区域 

U p6C:| -J- I I )-G[(D- l AD) r ] 

广 L 1 l-i Pr f 

中， … 

矩阵^有特征值 1 和 2 ‘ 直接应用 （krSgorin 定理只给出特征值的一个相当粗略 

的佔计(图 6. 1， 7a), 而后一个论断中的备用参数却为得到特征值的一个令人满意的估计提供 
f 很大的灵活性（图 6. 1.7b). 
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|?1 S. 1. 7 


练习考虑矩阵 




「 7-16 

-16 7 

s- 

- S 

_ 


l 8 -S 

- 5. 


试用 GerSgorin 定珥估计一下 A 的特征值以及 A 的谱半径.然后弩虑 D [ AD , 其中， D = 


dUgC ^,, p ,, p ,). 并且在你的特征值估计中，看 看 能否作 iMf 么 改进，最后，计算出实际 
的特征值.试对你所作估计的好坏给一个评价. 

练习证明. -4 的每个特征值位于集合 fV 从 D LAD ) 屮，其中交取遍只眞有 m 主对角元 
的所有对角矩阵. 

我们也可以利用引进自由参数的思想得到关干谘半径估计 (S. 1.5) 的更一般的形式. 


6.1.8 推论 

且 


设/1 = [«,,]6/^.则 
p(A) 




I 


P (A) < min max />, 2 T I I- 

6 ."..V' 1 . i'- I'- " ] A 

练习证明推论 ( fi . l . S ). 

练习设/\=广^ " I ，其中 a , (■和恒为实正数. 
w- dJ 


< a ) 用直 接计算求出一个具体的对角矩阵行.使得 i |, D 1 AD |! - mm,, | D MDl ,, 其巾 
极小取遍只具有正主对角元的所有对角矩阵. 

( b ) 计算; | ifi-]AD l .^ r . 

( c > 良接计算 〆 Ah 
( d ) 指出 r ™^( A ), 

以后将证明，如果 A 是任意一个正矩阵（或更一般地为不可约矩阵和非负 矩阵） ，则 
D _ AD 的极大行和在所冇/>上取极小一定等于谱半径.这对一般情形不成立. 
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r 

2 - 


， ii 明，对具#正九和灰的所有 D = diag (办. p ,) , p(A)< 


min ;| D 'AD I . 

如果有关于 一个矩 阵的某些附加佶息，它要求持征值位 T (或不位十）某尊集 合中. 那么. 
可以利用这个信息以及 Gersgorin 定理给出特征值的更为准确的佔计.例如，如果 A 是 
Hermite 矩阵，则 A 的特征值一定都是实的，因而它们一定位于集 RflA ) 中，它是实闭区 
间的有限并 . 

练习关于斜 Hermite 矩阵的特征值的佔计你能说些什么？关于两矩 阵呢？ 关于实正交矩 
阵呢？ 

因为一个矩阵是可逆的当且仅当0不是其持征值，所以.值得研究的是导出从包矜特征值 
的已知区域中去掉原点的条件. 

6 .1. 9 定义设 A ==[ h ] eM ,,. 矩阵 A 称为对角占优的，是指 

I I > | a" | = 

;1 

对所有 ; _=1，…，》成立.称 A 为严格对角占优的.是指 

I A r> 2 \ a„ I = 

i - y 

对所有， = i ， …，成立. 

从位置几何学可知，如果 A 是严格对角占优的，0不可能位于任何闭 Gersgorin M 盘中. 
另外，如果所有主对角元《,，都是正实数，则每 t 岡盘实际上位于开冇半 f - 而内；如果 A 还是 
HermiU ■矩阵，则特征值一定都是正数.把这些论断总结为下述定理，其中 （ a ) 部分称为 Lev y - 
DesplatiRues 定理 [ 见推论 （5. 6, 17)]. 

6. 1.10 定理设 A — 是严格对角占优的.那么 
U ) A 是可逆矩阵. 

( b ) 如果 A 的所冇主对角元都是 E 数.则 A 的所有特征值都冇正实部. 

( c ) 如果力是 HermiR ' 矩阵， A 的所有土对角元都是 If : 数，则 A 的所有恃征值都进正 
劣数. 

练习考察 G 0和 ll ' 说明仅有对角占优性质还不足以确保可逆性，并说明 
严格对角占优忡对可逆性不是必要条件. 

利用推论 (6. 1. 6) 的备用参数，作为可逆性的 ft 分条件的严格对角占优性假设可以稍微放 
宽-些. 

6 . i . ii 定理设/\=[\]&财„的所有对角元非零，是对角占优的，乂除 r != i 《 
的一个值以外，对所有其他的值有丨 u „ 丨 >R：. 则 A 是可逆矩阵. 

证明： 假设条件是说’对某个 h |办丨 且对所有，參 h U „ I >R：. 在 （6. l . S ) 
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中，对所有;'?^设久=1,且设九 = l+e. e>0. 于是，对任意 £ >0, 

^ a -> >! = | r ^ < I «« I > 

且对所有〖#(，， ‘ 

7~ 2?J I a -i I =兄 + e I U* |. 

P - f^i 

但是，因为 /?:< I «, I 对所有成立.所以选择充分小的 E >0, 使得 K:+e I & < I « u I 

对所有成立.因此，根据推论 ( S .1. S ), 点 z = 0 在 GtD ^ AD) 之外，因而 A 必定是可逆 
矩阵. □ 

GeHgorin 定理及其各种变形给出了 A 的特征值的各种包含区域，这些区域只依赖于 A 的 
诸主对角元以及各非主对角元的绝对值.利用 f AS 与 A 有相同的特征值的事实，可以得出 
(6.1.6〕，并且得出闭集 

「] G(D _1 AD>, <D = diagtpi ，…，户„ ) ,所有/>; > 0 (6.1.12) 

包含的所有特征值的结论.我们知道，如果可以采用比对角相似更复杂的相似，就有 
可能得到包含特征值的更小的区域，但是，如果只局限于对角相似，并且只限于利用主对角元 
以及非对角元的绝 对值. 能否设法得到比 （6. 1, 12) 更好的估 计呢？ 

回答是否定的，其理由如下：设 s 是集合 （6. L 12) 的边界上任一给定的点.那么， R . 
Varga 已经证明，存在矩阵 S = ] £ M „ ，使得对所有 / — 】，…，„有(》„=〜，而对所有 ；， j 
=1，…，《有| \ I = ， 并且 z 是 B 的特征值. 

习题 

_ 1. 考虑线性方程组其中 A 和> 是给 定的： 

(i ) 定义 BeI ..-A， 然后把原方程组改写成 r=B 工+兑 
(ii ) 按你所需要的任一方式选择解的初始逼近 
(iii ) 对 m = 0， 1, 2,…，计算 产 )+1 

(iv) 可以指望，当 ⑺时， y" 1 — 了 (解） . 

Ca ) 试用表示第 m 次通近与解的误差，并且证明 £ ln , = B ~( j ^- x ). (b) 证 
明，如果〆卜 A)<1， 则不论初始逼近，如何选择，在川-™时，■的意义下这个算法 
总是可行的- ( C ) 试用 Gedgodi! 定理给出关于 A 的一个简单明确的条件以保证这个算法可行. 

2 - 证明， fl,G(S- 1 AS)= ( r(A), 只要这个交取遍所有非奇异矩阵 S. 

3. 利用 (6. 1.5) 证明，对任意 

I del A JJ(X； ] a , |), 

且对列也有类似的不等式. 提示： 如果 A 的任意二行是零，那就无需证明.如果 A 的所有行 
都非零，则设6是这样的矩阵，它的各行是 A 的对应行除以该行的绝对行和，于是，根据 
(6. 1.5), P (B)<1, 因而 | detB | <1. 注意.这说明， 
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I det A K f[ II «, Hi. 

其中向量 A 是 A 的相应行(或列）.对其他范数 i 存在这样的不等式吗？ 提示： 见 （7.8.2). 

4. 在正文中，由 Gersgerin 定理 （6. L 1) 导出 了定理 （6. I. 10a)-Levy-Desplanques 定理. 
证明，由（ 6 -1. 10) 的 U) 部分可推出 （6.1. 1) 的前一部分[区域 （6. 1.2) 包含 A 的所有特征值的 
沦 断].提示：把 （6. 1. 】0a> 应用于矩阵一 A 

5. 假定是实矩阵，且它的 r ! 个 GerSgorin 圆盘都彼此分离.证明 A 的所有特征值 
都是实数.更一般地，如果复矩阵 A&M 只有实主对角元，且它的特征多项式只有实系数， 
乂它的《个 Gersgorin 圆盘都彼此分离，证明 A 的所有特征值都是实数. 

6. 证明.如果 A = 且对于 ( _的々个不同的值有 U,, | > R ：, 则々 < ra nkA. 

7. 假定 AeAi 是幂零的 (f =A ) 但是证明 A 不可能是严格对角占优矩阵[或不可 
约对角占优 矩阵； 见 （6..2. 25) 和 （6. 2. 27)], 

8■假定 A ^ M „ 是严格对角占优矩阵，即！ & j >允对所有；=1, »成立.证明 |如 

>t v * 对& = 1,…，〃的至少一个值成立. 

9. 假定 A = [〜] 是严格对角占优矩阵，且设 D = tli a g( U|| ，如， …， Urr „) ,证明 ， D 
是可逆矩阵，且〆/一_0'4)<1. 提示： 利用推论 （6. 1.5). 

] 0.设 A = 且尺 一 十 | 表疋 A 的第，'行所有兀素的绝对值的和，证明 



其中约定在这个和中 0/0^0. 提示： 用问一个非零纯量乘一行的所有元素不改变矩阵的秩， 
因 Ifii 可以假定 所冇〜 >0且所有尺或者是零或者是 1. 在这种情形， A 的所有特征值都位于单 
位圆盘内且可以证明 


rank A > 

I =] 

证明， S〜,=tr U I 的非零特征值的个数 < ran kA. 

11. 如果 [a J = v. ，证明 

rankA > |? i ^， 

其中约定在这个和中 o/o 二 a 提示： 如间习题 10, 说明只需考虑下述情形就可以 jf: A 的所 
有列有 Eudid 单位长度，即所有 a 在这种情形可以证明 

扇 k 乂 > U」 2 =公 | 彳。」、 

其中^，…， 匕卜是 C 的标准正交基.如果 A 有秩证明存在々个标准正交向讀 
…， Vi 6 C " 使得 SparWw ，…，= spank" …， （O* 于是 

«■ = Y ； iv ； a t )v f , mm e ； a c ^ J^(v ； a^ie ； v t ) } 

J = [ ； i 


且 
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2 I & i J ^S[(I ： h.-；,, i”(i ： u 、 n]=2E i. ； ^i 2 -i：i 

r " 1 - |TL 厂 ] ；= 3 Ji=r t t = ] J^l 

.=k — rank A. 

进一 步阅读用数值例 f 讨论 GerSgorm 定理可以在 [ Stc ] 中找到.原始资料可参看 S . 
Gersgorin . u Uber die Abgrenzung der Eigenwerte eiiier Matrix , ,f Akad . Nauk , S . S . 

R- 7(1931)，749-754. GerSgurin 定理有一个推广，它给出了关于广义特征值问题 Ax = 
ABi 的谱的包含区域，其中包括 B 是奇异矩阵的 情形； 可参看 G . W . Stewart , "Gerschgorin 
Theory for tht Generalized Eigenvalue Problem ，” MctzA . Comput. 29(1975), 600- G 06. 关于 
本节 M 后 -- 段提到 K 域 （6. 1. 12) 是否有更好的性质，可参看 R . Varga , '• Minimal Gerschgorin 
Math. 15(1965), 719-729, 


6.2 Ger 知 orin 圆盘——更细致的讨论 


^53； 


我们已经看到，严格对角占优性对于可逆性是充分的，但对角占优性则不是.某些 2 X 2 
的矩阵例子所需条件启发我们猜测，对角占优性连同严格不等式 

> !> 2 1 对< =1，… J 屮至少一个值成立 CS .2.1) 

> - \ 

可能是可逆性的充分条件. H 失望的是 ，正如例子 


所说明的那样，情况并非如此.这里究竞会出现什么情 形呢？ 

但是，关于对角占优矩阵，存存:普通条件，在这些条件下， （6. 2. 1) 足以保证可逆性， 
外 a 它们在图论中透导出些很有意义的想法.一个重要论断是，如果 a 是对角占优矩阵， 
则0不可能造任何单个 Gerjgcirin 圆盘的内点. 


练习证明，如果一个给定点 A 不是 A 的任一 GerSgorin 圖盘的内点，当旦仅当 


U 2 I £ J V [ (6. 2 . 2 a ) 

1 

对所有 i = l ， …，成立.证明 G (.4) 边界上的杻一点适合这些不等式.考察;1 = 0和 A 广 
f 丄 U®[ J —U 来证明， WA ) 的一个内点也可能满足不等式 (6 .2_2 a ：>. 


仔细分析定理 ( S . 1. 1 ) 的证明，当 A 的特征值满足不等式 (6. 2. 2 a ) 时会出现什么情形. 


6.2.3 引理设 A = A 是,4的位于 CiU ) 的边界上的特 征值. 上 = [/,] 

判，且假定 A 是使 I 心 I = max 1 ,. ;tji | j ., | = || j . Uo 的一个下标.那么， 

⑷如果 6是使 U ( I =丨的任 一 个下标，则 | A --^ I = R \； 即第 A 个 Gei ^ orin 圆 
经过 Ai 

Clj ) 如果对某个^“1 ，…，”， I I - I - r , | , 乂如果对某个 j^k, 则也有 
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I JTj I ~ ■ | ■X ^ | ■ 

证明： 正如在 Gedgohn 定理的证明中所证明的，有 

(A — a u =习化〆， 

对所有—】，■••， n 成立，因而 f 

\ X - a )f | | t, Y^a^-j j < 2 1 I = 2 I 叫 M A I 

1 / J 1 ,-] 

' / 丄 J 

\ a v U> I = i?； I ./> I. (6. 2. -1) 

J 

因此，如果 /; 是使 I ^ I =- I 心 I 的任 -- 下标，…定有 U —叫 \^ R ：. 但是，假设条件是，对所有 
/ = 〗，■‘+，”有 |A-i IX. 因此，对 ; '=h 在 (6. 2. 4) 的不等式两边，实际上应取 等式； 即 

U - a« li | = 2 \ a h \\ Xj ^ \ u t! | | .r t I = Kl I I , (t) 

■r = ] j =] 

J 达 k !‘k 

因为 I A I = hi )0, 所以论断 U) 可以从恒等式 . 

I A - I ! - R[ I Jit i 

推出.论断 (b) 可从 (f)t 的中间恒等式 

I “ 知 I U -| 心丨 ）= o 

厂 I 
•/上友 

推出，因为在这个和中每一项必是非负的. 口 

这个引理舂 起来更 偏重于技巧， f 日.是它有下述有用的结果及其推论作为直接推论. 

6.2.S 定理设又设1是4的特征值， & A 是 G(A) 的边界点，或更一般地， J 满足 
不等式 (6. 2. 2a ), 假定 A 的所有元都是非零元.那么 
(a) A 的毎个 Gersgorin 圆经过 A; 

<b) 如果 Ai = Aa'， j . = [ j _,] 尹0，则对所有 ；， j = l , ■•■, h 有 I ：r, [ = i jr; I . 

练习从引理 （(5. 2. 3) 推导定理 （6. 2. 5). 

6 . 2 .6推论设 A 二[〜] 6JW,,， 且假定 .4 的所有元都是非零元.如果,4是对角占优的.且对 
;=1，…，"的至少一个值有 U,, 丨 > R ： . 则 A 是可逆矩阵， 

证明： 假如 A 不是可逆矩阵，则0就是 A 的一个特征值.因为 A 是对角占优矩阵，所以 
0不可能是 G( 4) 的内点，因而它—定是一个边界点 • 定理 （6. 2. 5) 说明，每个 GerSgorin 圆必 
定经过0,但是，如果|«„ | >；?:,则第 i 个圆不可能经过 0. □ 

前一个结果既实用，也有意义，不过，如果利用引理 （6. £. 3 * * 6 )中更细致的结果，还可以得 
到更好的结论(不涉及 A 中有关零元的假设条件). 

6. 2, 7定义我们称矩阵 A 二 [aJeAi 具有性质 S(;, 是指对适合 Kf, 的每对不同的 

赘数 f， IV， 存在一 系列互不相同的整数 h ， …，, k „= g , l < ra < n , 使得所 
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有矩阵元素叫化* 3 ，…，\人都是非零元. 

例如，矩阵 (6.2. £) 不具有性质 SC ， 因为数对2, 1不容许有这样的非零元序列.但是数 
对1, 2的确有这样的序列. 

[ p ?」 利用这个概念和引理 (6. 2. 3)，可以得到关于 (6. 2. 5) 的下述改进. 

6.2.8 较好定理设 A =[ u , JeM ,,, 又假定 A 是 A 的特征值 ， R A 还是 G ( A > 的边界点，或更 
一般地， A 满足不等式 (6. 2. 2 a ). 如果 A 有性质 SC , 那么， 

U ) 每个 Gersgorin 圆经过 A ; 

( b > 如果 AjU ，K ^-[ x ; ]^0, 则对 所有! ■， j _ = l , …，„有 I a ! = I . 

证明： 设 -4 尸 A _ r ， 且对所有！ = 1，…， r ； 有 | _ r , | <丨心 | = || 门 | ,> 0 ,于是由引理 
(6.2.3 )， I X~a ff =R' P . 设(/是任一其他下标， q^p. 因为 A 有性质 SC ， 所以 
存在一系列互不相同的下标 t 办:，是, ， …_ k,„=q, 使得所有矩阵元素化…，…， 

都非零.因为山々=4, ; #0，根据 （6.2. 3) 的论断 （ b ) 可知， I 心丨= | 心， | . 但另一方面， 
“ V ，尹0,因而 I % I = | & | = | a | . 继续这样做下去，得知，对所有 i = l , m 有 
U *, I， I I ,因而[由 （6.2. 3 Ha )] 有， | A — | = U — “ w | = i ?； ；即第 个 
Gedgorin 圆经过 A R . U , | = | j -, | . 但因为 g 是任意下标，得知每个 Gersgorin 圆经过; I 且 
所有丨 ~ r , i = j 丨，^=1，…， h . Q 

如冋 ( s . 2 . e ) 中 那样，从这个结果可以椎导出一个关于可逆性的有用充分条件. 

6.2.9 较好推论设 A =[«,,] eM „， 且假定 A 有性质 SC . 如果/\是对角占优的，又如果对: 
二1 .…，《的至少一个值有丨 I 丨 > R ：, 则 A 是可逆矩阵. 

练习由 （ fi . 2. 8) 推导 （ S . 2. 9). 

练习证明矩阵 <6.2. 2>不具有性质 SC . 

这个陌生的性质 SC 指的是什么？注意到，它只涉及 A 的非零非对角元的 位置， 不涉及主对 
角元，且非主对角元的具体值是无 X 紧 要的. 由 f 这个缘故，我们定义与 A 有关的两个 矩阵. 

6 . 2.10 定义如果 A = 令 I A | ==[ | “„ I ] 和财(4)=[私,]，其中，如果〜垆 

U . 则二1，如果则内=0.矩阵 M ( A ) 称为 A 的指标矩阵. 

练习证明，矩阵 A 6 M ,, 有件质況:，当且仅当丨 A !或者 M (/ l )( 因而两 者都} 有性 
國质义 

在叙述性质 SC 过程中出现了 A 的非零元序列概念，它可以用与 A 相关联的一个图中的某 
些确定道路来形象地描述. 

6.2.11 定义 AGM ,, 的有甸图，记作 r ( A )， 是关于 n 个结点 P, ， h 的有向图’且 

有以下 性质： 在 r ( A > 巾#在一条从尸到圪的有向弧’当吓仅当\尹 0 (〜关 0 ). 

例 

A = } IW 
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6.2.12 定义图 r 中的有向道路 y 是 r 中的一个弧序列心尸, 2 , p h p , 3 , p^p, t , 有向道 
路 y 屮的有序结点表是 p,, ， p, : ，…. 如果在有向道路中，依次出现的弧的数目是有限的，就 
称这个数为诙有向道路 的长； 杏则，就称有向道路有无限长.一个 ® 路是起点和终点在同一个 
结点的有向 道路； 这个结点在该道路的有序结点表中恰好出现两次， a 在该表中，没有其他结 
点出现两次 以上； 有些作者称这个 k 路为简单有向回路.长为1的回路称为圈或平凡回路. 


6 - 2 . i 3 定义有向图 r 是强连通的，是指在 r 中的每对不同结点尺，乃之间都存在一条以厂 
为起点，乃为终点的有向道路，且有有限长. 

6 . 2 .丨 4 定理设 A & M . 那么， A 有性质 St ’， 当 M 仅当有向图 r ( A ) 是强连通的. 

练习证明定理 6. 2. 14. 

练习证明如果 r 具有性质：每对结点至少属于一个回路，则 r 是强连通的，但是，逆命 
题不成立.提示： 


'0 1 0 - 
10 1 . 

.0 J 0_ 

在有向图的两个结点之间，可能存在多条有向道路，但是具有不同长度的这样两条道路可 
能没有本质的差别；它们可能包含一条或多条1复出现的子道路.显然，如果我们沿着一条有 
向道路前进时，曾两次遇到某个结点，那么去掉第一次遇到该结点到第二次遇到该结点间的所 
有中 N 弧（去掉的子图是一条冋路或包含一条回路），这条有向道路便可以缩短 C 且两个端点不 
受影响). 


6,2.15 论断设 r 是>1个结点上的有向图.如果在两个给定的结点之间存在 r 中的一条有向 
道路，则在这两个结点之间存在一条长不超过 f - i 的有向道路. 

我们应该怎样说明给定的矩阵 A 是否具有性质 sc 呢？这等价子验证 r ( A ) 是否是强连通 





的.如杲 w 不很大，或者如果 m (. a ) 有一个特殊的结构，那么可以只检査 r ( A ) 并划出所有可 
能的结点对之间的道路.但是，这在一般情形下是不劣用的，因此需有某个明确的计算方法. 
6.2.16 定理设是给定的矩阵，又设尸和尺是厂(.4)的给定结点.那么，在 R 和朽 
之间存在尸（ a ) 中的一条长为 m 的有向道路，当且权当 （ | a n „ 尹0,或等价地，如果 

证明： 我们用归纳法证明.对 M 二1,结论是明显的.对 W — 2,算出 

LL 4；-'].^ 21-1 A |]*[|.4! 1(^1, 

t ] i -] 

WifU , E I A | ； i ^0 f 当 II 仅当对 6 的至少一个值，〜和叫都是非零的.但是，这种情况成 
立，当 n . 仅当在 r ( A ) 中存在一条从尸到尺的道路. 一 般地，假定对^二^结论巳经证明. 
于是 

[ I -4 | 1 ] ；J — 2 LI 1 4 [ I .4 | ] t; — 2 L' | *4 | \ at, \^= 0 

卜 I fc J 

当且仅当对々的至少一个值 ， [I A 卜]*和 | 叫 | 都是非零的.这等价于有一条从 f ； 到乃的 
长为 <7的道路及一条从 P * 到 P , 的长为1的道路，而这种情况成立，当且仅当存在一条从 R 到 
尽的 长为？ 十1的道路.同样的证明对 M ( A ) 也是可行的. □ 

6, 2. 17定义设 A 二 [ U (1 ] eM a . 我们说 A >0( A 是非负矩阵），是指它的元素〜都是非负实 
数.我们说 A >0( A 是正矩阵），是指它的元素〜都是正文数. 

6.2，18推论设 A 6 M ,,. 那么 ， I A |"'>0， 当且 仅当从 r (-4) 中的每个结点尸到每个结点 
屺，在 r ( A ) 中都存在一条长恰好为 m 的有向道路.相同的结沦对 M ( A ) m 也成立. 

6.2.19 推论设 ACAC 那么， A 有性质 SC ， 当且仅当 | A | )" '>0, 或等价地，如果 
[/ + JW ( A )] u _1 >0. 


证明： （ J + M I )" -1 = / 1 ( n - l ) | /I | 十 (" ，^ | A I z -1 … f 广 1 j I A I " _1 >0, 当 

^ 2 f \n —2 > 

且仅当对诸结点的每对“， ））， i 芊]， 在诸项丨 a 丨， | ,41 2 , | a 中，至少有一个正 

U， ； ）元.但是，定理 (6. 2. 16) 说明，这种情况成立，当且仅当在厂 (A) 中存在从尸到 P, 的某 
条有向道路.它等价于 r(A> 是强连通的，而这乂等价于 A 具有性质 SC. □ 

练习证明推论 (6. 2. 19>中涉及 M(A) 的论断. 

6.2._20 推论 在厂(/\)中存在从 R 到巧的道路，当且仅当「（/+丨 a 丨 r ] 丄垆 0 . 

练习试用推论 (6.2.19) 给出关 于性质 SC 的一个明确的计算检验法，它只需要对矩阵自 
乘大约 logjf ； — 1) 次，而不是《 — 2次- 提示： 考虑 （/+ |A I -) ? ,这是平方，然后依此类推. 

在结束这个论题以前，我们要引进性质 SC 的另外一个等价的描述.它基于厂 (A) 的强连 
通性只是 HA ) 的拓扑性 质这一 事实… -- 它与 r ( A > 的诸结点所规定的下标毫无关系.如果改变 
诸结点的下标顺序，图仍然保持其强连通性或非强连通性.要注意的是，如果交换 A 的第^行 
和第 j 行以及第/列和第 j 列，这对 r ( A ) 的影响是交換结点尸.和 g 的下标，反过来也 
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一样. 

我们知道，转 置矩阵 P 是方阵，它的所有元素为0或1;在 A 的每一行和每一列恰好有一 
个 1. 显然，这样的矩阵是酉矩阵，因而是正交矩阵，所以户二户― 1 .最简单的置换矩阵 P 对 
i ， J 的毎个固定选择有 = II 所有其他非对角元为 0. 于是，相似 P T A 尸対 A 的作用 
是交换 A 的第；列和第 j 列以及交换 A 的第 ； 行和第 j 行. A 的行和列的任一置换可以依次用 
这种形式的交换来得到.并 ri 任一置换矩阵是这样一些简单置换矩阵的有限乘积.闶此，如果 
P 是置换矩阵，则通过适当置换 .4 的若干行和列可由 .4 得到相似 P T A 广重要的是要知道， 
是否可以求得 A 的行和列的某个置换把 A 变成下述特殊的分块形式. 


6.2.21 定义矩阵 A 称为可约的，指的是 
= 或者 

( b )">2, 存在置换矩阵且存在适合的某个整数 r , 使得 



其中， B € M r , DeM „.. r , C € M,.„. rt 且06轧 r . r 是零矩阵. 

注意，我们并没要求子块 S ， C 和 D 有非零元，而只要求通过一系列行的交换和列的交换 
可以在指定的位置上得到一个由0元组成的 （n — r ) Xr 子块.如果 | A |>0, 显然 A 不是可约 
的，乂如果力是可约，则它至少必须有— 1) 个0元. 

附注假如想解线性方程组 A_r = h 且假定 A 是可约的.于是，如足记 A = f T AP = 

[ 0 D ], 則有 Ar 二或 = $ P : =; .呵^ ;(叩- (来知） 

和 p T y =： v =[ u / (已知），其中， ：:， wtc . 而（， \ 因此，要解的方 
程组等价于即等价于 

-f- Cf — ^ ? 

=⑴， 

如果首先对 f 来解 Df = ty ， 然后在第一个方程中采用 f 并且对^来解 S 2 = W — t ：〔， 那 
么就把原来的问题化简成两个较小的问题.一般说来，它们应诘是比较容易解决的. 

这番评注就是促成定义术谱可约矩阵的理由. 

6.2.22 定义如果矩阵 A £ M „ 不是可约的，就称 .4 是不可约的. 

2. 23定理矩阵 AeM „ 是不可约的，当 | i 仅当 

(I + \ A |) ir 1 >0 ， 

或等价地，如果 [J + M ( A)] B '>0. 

证明：我们实际上要证明， A 是可约的，当且仅当 （ Z + A | )" ! 至少有一个零元.首先 
假定 A 是可约的，且对某个置换矩阵 F 有 

A = P [o :卜咖 ' 


_ 
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其中[:, 0和 D 是定义 （ 6. 2.21) 中的分块矩阵，注意到 P 的作用仅仅是交换行和列的顺 
序，所以 I〜= I PAP " I =P I S I P 、同 时还注意到 ， I A I A I 3 , I A I " ■和 
A —样，在其左下角都有相同的 (《 —『)Xr 0 子块.因此 

(i+| A )-' =(7+P I A I P T )-' = (P[l+\ A |]P T 广 1 = P(I4-| A D'-'P 7 

- p [ z +( n ~ l ) lAi + r ； 1 )! A |: + ‘‘‘+(::;卜3卜-十 1 .， 

且上述方括号中的‘所有项在其左下角都有 U — r)Xr 0子块.于是. ( f + M I 是可约的， 
_ 因而它的所有元不可能都是非零的. 

反之，假定对 某个户关？， (/+ I A I )" 1 的 （/», W 元是 0. 于是得知在 r ( A ) 中不存在从 
P f 到 P ,的有向道路.定义结点集 

S ! ^ { p 1； p , - P , 或在 r ( A ) 中有一条从尸到尸，的道路） 

又设 s ? 包含 r ( A ) 的所有不在中的结点.因 US 2 = 且所以 

FJ . 如果从&的某结点只到氏的某结点尸有一条道路，则(根据 S , 的定义)存 
在从尸到 P , 的道路，因而乃已在 S , 中.因此，从 S 2 的任一结点到 Si 的任一结点不可能有任 
何道路.现在我们重新标记结点，使 s ; = 彳戸 i ，…， P ,1 •和& = #」，，..-， PJ , 注意到 

^ = P T AP - C D ], Be M r , Of M 一 

因此 A 是可约的.关子 [/ + M ( A )]” ，>0的证明不过是作同样的论述. □ 

我们作一下总结. 

6 . 2 .24定理设 A 6 M ,,. 则下列命题 等价： 

( a ) A 是不可约矩阵； 

( b ) (/+ | A 广」>0; 

( c ) [/ + M (^)]~- , >0 i 

( d ) r ( A ) 是强连通的； 

( e ) A 具有性质 SC . 

6 . 2 .25 定义 设 AeJW „. 称 A 是不可约对角占优矩阵，是指 A 适合以下条件： 

( a ) A 是不可 约的； 

( b ) A 是对角占优的，即对所有， = 1 , …， „有 | u „ | ^R'(A )； 
k ) 对/的至少一个值《有 U , 丨 >R'AA). 

练习用例子说明，一个矩阵町能是不可•约的和对角占优的，但不是不可约对角占优的. 
(MD 采用现在的术语，可以 S 新表述“较好定理 ”(6. 2. 8) 及其推论如下： 

6. 2 , 20 定理设 A t M „ 是不对约的.则仅当每个 Gersgorin 圆经过 A 时， GerSgorin 区域 
G (4) 的边界点 A 才可以为 A 的特征值. 

6.2.27 推论 ( T aUSS ky ) 设 .4= [〜] 是不可约对角占优矩阵.那么， 

U ) A 是可逆矩阵； 
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( b ) 如果所有 a „>0, 则对 A 的所有特征值 A , 有 R e U ,)>0; 

( c ) 如果 A 是 Hemiite 矩阵(或更一般地， A 只有实特征值）.又如果 A 的所有主对角元都 
是正的，则 A 的所有特征值都是正的. 

6.2.28 推论设不可约矩阵，且假定对 ; '的至少一个值有 

= 2 i i<IMIU ， 

卜1 

即不是所有绝对行和等于极大绝对行和.则 〆 A )<| A | t . 更一般地，如果丸，…1 p〉o, 
如果 


D = diag(^i ， p” … ， p „、 ， 

又如果对；的至少一个值有 i^D MOXilD MDi ,则〆 A)<]|D _MD|L- 

证明： 我们总有界〆 A)<||Ai,， 而等式成立，当且仅当存在 A 的某个特征值 A 适合 | A | 

= \\ A \ l ^ 另一方面，根据定理 （S.2.26)， 每个 GerSgorin 圆必定经过 A. 但是，某个尺<||| A 
的假设条件与这相矛盾.把同样的证明应用于 DHAD 便得出第二个论断. 口 

习题 

1- 证明不可约矩阵不可能有0行和0列. 

2. 用例子说明推诒 (6. 2. 28) 中的不可约性假设是必不可少的. 

3. 假定 A = [«„.] 6M„, A 是 I A| =[ I \ I ]的特征值，.且存在所有 x ,>0 的向量 = 

Dr,]e IT 使得 I A I / = 设 D ^ diagf ^, , r „). 证明 D 1 | A [ D 的每个 [363] 

GerSgomi 圆经过 A, 画出它的图形.关于 D 'AD 的绝对行和，你能说些什么？ 

4-在第8章中将证明，具有正元素的方阵总有正特征值和相应的正特征向量.利用这一 
亊实和上一个习题证明，只要 A 的所有元是非零的 t 就有 
p ( A )^ p ( \ A |). 

试用连续性证明， A 的所有元是非零的条件可以略去，因而对所有 AfM, 有 

p { A )^ P (\ a n . 

5. 试用推论 (6. 2. 28) 证明，关于多项式 

p(.z) = 2 M + z" 1 + …+ 中 2 ： + flu ， <in o 

的根的 Cauchy 界 （5. f；. 40) 在不出现下述情形 

I «0 I = I 1+ 1 = I If] =…= I i |-f 1 

的假设下可稍许改进为 

| 2 | < max{ I a 0 I , I a, | + 1, | a ； | + 1 ，…， | «„ , |+ 1}, 

提示： 证明，若叫弇0，则 （ 5 ‘ 6 . 39 ) 中的友矩阵 C(/>) 是不可约的，对 Montel 界 （5. 6. 41)， 
Carmichael 和 Mason 界 （5. 6. 42) ， Montel 界 （5. 6. 43) ,以及 Kojinia 界 （5. 6.15) 可作何改进？ 

进一步阅读关于 I-evy-Desplanques 定理的讨论以及许多有关的参考文献可参看 0. 
Taussky, "A Recurring Theorem on Determinants," Amer . Math. Monthly 56 ( 1949 )， 
672-676. 
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6.3 扰动定理 

设卩二出叫“，， A ? ，…， A „) e M ,, ,设 K =[ q ] eM a ， 并 J 1 考虑被扰动矩阵 D + E . 根据 
定理 ((5. 1.1), D + E 的特征值在诸圖盘 

{z e c ； | z -'A, -- e,i |< R: (E) ■= ^] I «*„■ I } , f = 1 .…， n 

J -] 

_ 中，它们乂包含在诸圆盘 一 

{ K 6 c ： : — A, I ^ R, (E) = 2 I e lr I } , 1 = 1, r! 

中，因此，如果 i 是 D + E 的特征值，则存在 D “某个特征值 A ,, 使得 U — A , |<| L '!| u . 遗 
憾的監，这个简单的佔计不能推广到一般（非对角）的情形， 但是， 在矩阵是可对角化的情形， 
可以给出一个简单的界. 

6.3.1 论断设 A 6 M ,, 是可对角化矩阵 ， R A 二，…， A ,). 设 E 6 M „. 
如果 A 是 A + E 的一个特征值，则存在 A 的某个特征值 A ,, 使得 

I A - A , |< js | JS 1 !j =«. C . S )'| E |||„ 

其中 K . (■: i 表示 JtF 矩阵范数 ||_ |. 的条件数. 

证明： 因为 A + £ 和 S ! ( A + E)S = A + S TS 有相同的特征值，又 W 为 A 是对角矩阵， 
所以， 前述论证说明，存在某个 A ,, 使得 1 A - A , I -^ fS -' ESlI 1 .. 因为 | _ | .是矩阵范数，因 
此所述不等式成立. □ 

在技巧 上稍作 修改，便可把这个结果推广到不同于极大行和范数的其他矩阵范数.矩阵范 
数的关键假设都被单调或绝对向量范数诱导的所有诱导矩阵范数满足；见 (5. 6. 37). 

6.3.2 定理设 AGM ,, 是可对角化矩阵，巨4二 SAS ，…， A „). 设 £6 M „, 

又设||_ 是这样的矩阵范数，使得|0|||=抓 3 ^〜|<|对所有对角矩 KD = di a gW ,, …， 4,) 
6 M „ 成立.如果 A 是 A + E 的一个特征值，则存在 A 的某个特征值 A ,, 便得 

I A - A , |< !| S ：! is -' !! !!| E |||-«( S ) \\\ E \\, (6.3.3) 

其中是 XT 矩阵范数 II . _ i _|| 的条件数. 

证明： 如同上一个结果那样，只要考虑 HA + E)S = A + S ] £ S 的特征值就可以了.如 
果 A 是 A + S 的特征值，剐 A / - A-S iES 是竒异矩阵. 如果八 一71 是竒异矩阵，则对每个： 

# A = A ,, 因而界 ( S . 3. 3：) 显然被满足.但是，假定; U - A 是非奇异矩阵.在这种情形，矩阵 
画 ( XI - A ) ' Q / - A-S l ES > ^ 1-( X 1 - A)-'S l ES 

是奇异矩阵， Wifij ， 根据 （5. 6. 16>， 一 定有 |( A /_ A ) _1 - S - 1 ES ||>.1. 于是， W 为假定矩阵范数 
;| l-||i 关于对角矩阵所具有的性质，冇 

1 <：||( A 7- A)-\S ' ES|<|S iES | ；|(AJ - A ) 1 j , 

= ||：S 'KSlimax | A— A , |..] = , 

'' min [ A — A, | 
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H 此 

min | A A, !si |： S 1 ES |i < ,| S 1 i ||S|' ,E | - K (S) ij| K：|. n 

练习 证明， 定理 （ G . 3. 2) 假定矩阵范数在对角矩阵上所貝.有的性质，下列各个范数都满 
足： 1* | 2 , : *| l - I * !.• 至少给出另一个矩阵范数，它也满足上述假设. 

练习给出一个矩阵范数.它不满足定理 (6. 3. 2) 的假设. 

练习证明丨 U | = l 对任何 W 矩阵成立. 

虽然在 05. 8) 中曾 出现过 条件数 K (_)， 它是由 f 线件方程组解的误差界引起的，但是我们 
舂到，现在在 （ S .3.3) 中也出现了条件数，不过它是在计算可对角化矩阵的特征值中作为误 
差比 

的上界而出现的.如果 《( s ) 较小（接近 1), 则小的数据扰动可以使特征值产生扰动，不过特征 
值的变化范闱以数据变化的相同数量级为界.但是，如果很大，则小的数据扰动可能引 
起特征值的比较大的变化. 

与 （5. 8：!屮关于线性方程钽解的情况不冏的是， / f _: 这 S d A ) 没有多大意义.但是 K ( S >是 
很茧要的，其中， A--SAS 而 S 足以 A 的特扯向 M 为列的矩阵.又下谱范数的条件数具有 
的几何解释，其 iM 是当和. V 取遍所有可能的非零正交向量时 S _ r 与 S _ y 之间 
的 ft 小夹角[51例 （ 7. 1.2(5)].因此，它不依赖 -4 的条件数-如果 A 的一对线忡无关的特征向 
讀接近 甲行， 那么 S 的两列<例如，笫 p 列 fll 第 g 列，可能接近平行， W 而，即使单位基 
向6 和〜是 FH 交的， Sq ■，的央角仍可能很小.在这种情形，潜条件数 WS ) 将很九， 
Ifil 确定 .4 的特征值问题就可能是病态的. 


但是.如果 S 是酉(或接近于两）矩阵.则 S 将把一对 TH 交向量变成 IK 交（或将近于正交）向 
M , : 的谱条件数将会很小（实际上.如果 S 是酉矩阵.它等于 1). 在这种情形，确定 A 
的特怔值的问题一定 M 良态的.当然，一个矩阵 （ 恰好）可以_內对角化，当且仅当它是正规矩 
阵.所以，（ 6 .〗.2)给出了关于整个正规矩阵 （ 特别是 Hermite 矩阵和实对称矩阵）类的扰动定 
理，它与原来的关于对角矩阵的论断具有同样简单的形式.正规矩阵关于特征值的计算是优 
态的. 

6,3,4推论 设 -46 M ,, 是其有 特征疸 A A ,, 的正规矩阵，乂设 EeM „. 如果 A 是 A+E 

的特征值，则存在 A 的某个特征值 A ,， 使得 IA — A , I < lE \\ 2 . 

注意，扰动矩阵£：和被扰动矩阵 A 十£都不一定是止规矩阵.推论 （H 4) 常常应用于实 
对称矩阵 A 的情形. 

练习给出推论 ( fi . 3. 4) 的详细证明. 

练习如果知道 A 和£都是 Hcnmte 矩阵.则可以利用 Wcyl 定理 （4. 3. 1>给出比（6.3.4) 
巾的界吏好的界.如果 A , EeM ,」 是 Hermite 矩阵，乂如’果 A , C …是 A 的冇序特征 
值， AsiUeC …；是4十尺的冇序特征值，是 E ■的有序特征值，试用不 
等放 a 3. £) 证明，对所有丨 ， 2, …， 




I A ( -A, = \\El. 

说明为什么这个界比 (6. 3. 4) 好.如果已知£:的所有特征值是非负的，这提供了什么信息？ 

在数值应用中.原矩阵 A 和扰动矩阵 E 都是实对称的情形并不少见.在这种情形以及在 
.4 和 A + E 都是正规矩阵的更一般的情形，关于扰动，存在一个对所有特征值都适用的涉及全 
局的界. 

6. 3.5 定理< Hoffman 和 Widandt ) 设 A , E € M „. 假 定力和 A + E 都是正规矩阵，设 U 1; 
…，是按某个顺序给定的 A 的特征值，^ ，…， I ,」是按某个顺序给定的 A + £ 的特征值. 
则存在整数1, £，…，^的一个排列使得 

「公 1 L,! — A, | 2 ]* Z < || E |U. (6. 3. 6) 

证明： 设羞二出叩以,，…， AJ , A = diag ( A ,, A „), 设 Ve M „ 是使 A = Vyi V ‘ 的酉矩 
阵，而 W € At 是使 A + E = WAW ■的酉矩阵.于是，因为 Frobenius 范数是两不变的，有 
II E || 卜 || CA + E )-,4 |H 
=|| WAW r - VAV " HI 
= WVWAWV-A ||^ 

=tl zAz - - All ? 

■= it ( ZAZ ' — AMZiZ * - A )" 

= trCAA " + M - )~ tT ( ZAZ r A ' + AZA ' Z ' ) 

= M + lA , I ") — 2 Re tr ( ZAZ " A ") > 

i-l 

其中已令这个表示式说明 

II E\[i^ 士（| ( +1 A, r)-2max{Re xi(UAV A' )-.V 是两矩 阵） . （ 6.3.7) 

我们要证明’这个下界的精确值就是所确定的界 （ s . 3 . s ). 如果 u 三 [ D ] eM „， 则容易算出 
Retraj-AU-A' ) - X ； ! ? Rea,A,), 

而我们感兴趣的是，当 U 取遍 所有” Xn 西矩阵 k 成的紧集时.这个表示式的极大值.如果令 
I £ '且设 c =[ ( ,,]， 则矩阵就是具有非负元的矩阵，且它的所有行和与所有 
列和恰好都是十 】 （因为因而，只要 C / 是酉矩阵， C 就是双随机矩阵，乂如 
果修改我们的极值问题，允许取所有双随机矩阵，则我们将在一个知道其结构的紧凸集上更有 
利地考虑这个极值问题，在这个较大的区域上的极大值当然可能更大一些： 

ma X { R e tKimfUU 是酉矩阵} = max { | u „ | 2 Re ( U ,) :U 是酉矩阵 } 

r ，广 1 

是双随机矩阵） 
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但是，这个求极大值的函数是紧凸集上的线性函数，所以在该凸集的一个端点上取得极大值 
(见附录 B 并且注意到线性函数是凸函 数）. 根据执吐!《^定理(8.7.1)，双随机矩阵集合的各 
端点都是置换矩阵，因而存在置换矩阵 F 6 M „, 使得 

max { J ^ ReaA,)，C 是双随机矩阵 }= Rc tr ( PAP r /l - ). 

1 

因为置换矩阵是酉矩阵，所以也有 

madRe trO / At ；■ ) : U 是两矩阵 ；= Re ir(PAP T A' ). 

如果对 /— l , 2，…，《 有尸 e ,— ，，则 

Re \r(PAP J A' ) = ^ ； Re(U )， 

r-] 

而 （6. 3. 7) 说明 

|[ Ei |!> SUL , 卜十 I A , j —2 Rea 0( „ A ! )] 

f •) 

=I A , I 2 . □ 

定理 (6. 3. 5) 说明，对正规矩阵的特征值集合，存在很强的全局稳定性，但是它没有说明 
究竟是特征值的哪个排列将满足所述不等式.并不是特征值的每个排列都满足这个不等式，实 
际上，至少存在特征值的一个排列，可使 （6. 3. 6) 的不等式反向（见本节未习题 7). 然而，在 
Hermke 矩阵这一重要特殊情形，特征值的自然顺序能满足 (6. 3. S ) 中的不等式. 

6 . 3.8 推论设 A , £6 M „ ，假定 A 是 Hermite 矩阵 .A + E 是正规矩阵，设 U ,， …，； U 是 
A 的特征值，且排成递增顺序…乂设 U ,, …， U 是 A + E 的特征值，使其有 
顺序 Rei 1 < Rd 2 <‘.< R e l .则 

[E I I 2 ] 1 ' 2 < ii ^ ii ,. 

j 1 

证明：根据定理 (6. 3. 5). 存在 A + E 的特征值的给定顺序(递增实部）的某个 排列〜 使得 

[2 i Ad r ]'.? < li t | l ,. (6.3.9) 

如果 A _ i _ E 的特征值在表 1 以, ，…，中已使它们的实部成递增顺序，那就没有什么可证的 
广否则，在上述表屮有两个相邻的特征值，其实部不按递增顺序排列，例如，对某个适合1 
<走<«的4， 


Re Afl^j ^ Rt 3 Ajt*-^i ■,. 

但是，因为 

I 夂 ⑴ -At |- f| (⑷） — A … I 2 = I A F(t _n — hr I 2 -M — Ah I 2 

十 2U* — Ati-i )(Re A^^-n - Re , 

乂因为拫据假定， A ,- 所以得知 

U ㈣ — A* I 2 4- I ~h\-i \ z >1 Awii) — Ai I 2 十 I A, … —A^i |\ 

因此，可以交換两个特征值 九⑴和 且不增加平方差之和.通过有限次这样的交换，特征 
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值表 Ln， …，夂 ->51 以变换成表I，…，I，使其实部是递增的， a 所确定的界成立. 

□ 

实际上，这个推论经常应用于 A 和 A+E 都是 Hermite 矩阵或者甚至于是实对称矩阵的情 
形. 

练习证明，如果 A, B6M,, 是 Hermite 矩阵乂如果它们的特征值都按递增顺序或都按 
递减顺序棑列，则 


(^[AJ.AJ-A.CB)]-) 1 ： ^ II A - BiU. 

；-L 

练习说明，如果 A 和 B=A + E 不都是正规矩阵，则定理 （ S .3.5) 中的结论不一定成立. 
[3701 提示： 设4 = [^ ~ j ]- 然后 说明- 对特征值的 flU 

I 

2[ A ,( A )-^( B )] ; = 16. 

如果3不可对角化，就不知道有像定理 （ S . 3. 2) 中那样简单的界.但是冇可能导出一个简 
明的公式，它说明，当矩阵的元素产生扰动时.矩阵的代教单重特征值（代数重数等于 1) 如何 
变化.首先给出一个引理.说明相应于一个单重特征值的左特征向景与右特征 向董具 有非正 
交件. 

6. 3. 10引理如果 A6M „. LiAl .4 的代数单重特征值，乂如果 j 和, v 分别是相应于,4的特 
征值 A 的右特征向 M 和左特征向则 yj .， o . 

证明： 如果 Ar = A ^, 关 0. 则可以采用在 Srh ur 角化定理〔2.3. 1) 的证明中所使用过的 
方法，构造其第1列是 WII 的酉矩阵 L 7, 使得 

U- AU = [ A -| " l,Be M „.,. 

Lo . it 」 

因为 A 是 A 的单重特征值.所以它不可能是 B 的特征值.单位基向 Me 是 U - At ； 的属于 A 的 
特征向量.现在考虑 


( U - AU )' -[/' A " V - |_ n : 」， 

且假定 U ’ A ' K = A 2 , 其中文关 0. 如果 f =[0 lf ‘ l ， 贝且芒是 IT 的属十乂的特征向量， 
另…方面， A 就应是 / i 的特征值，这_假设相矛后.由此得知， r 不能以零作为第一个分量， 
即二’ e t ^ 0 . 但是 (UW ( O ,( is 和 t *, 逛 A 的属 f A 的左特征向董和右 
特征向 M . 因为根据假定， A 的关于; I 的左特征空间和右特征空间都是一维的，所以对某个 a 
尹0，一定有 但是 . r = || LUq ，因此: y ' —定成立. □ 

练习考虑 j], 说明，如果从假设条件中 略去“ 代数单 重”. 则引理不成立. 

现在假定 A 是 A 的代数单重特征值.于是 A 有唯一（除了差一个纯 M 因子 a 以外， 

_ =1) 确定的正规化右 A 特征向 量1 和唯一确定的左; I 特征向量: y ， 它可以通过关系，1=1正 
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规化.如果考虑可微的参数族 A (0, 使得 A (0)= A [例如， A ( t)=A + tE , E 为固定的扰动矩 
阵],则对所有充分小的存在 AG ) 的唯一确定的单重特征值 Kf ), 使得 A (0)= A . 同时存在 
一个右 AU ) 的特征向量它由条件， = 1 唯一确定（如前，差一个因子 d 还存在一 
个左 K ;) 特征向量 yU ), 它由条 ft 唯一确定. 

如果微分这后一个正规化条件.则得到恒等式 

/' (山-⑴十 y ⑴/⑴= 0. (6. 3, 11) 

因为 A ( f ). Kf )= A (?). r ⑴对所有小的；成立，所以也有恒等式 7 i (() A ( t ) J - C /)= A (/). y , ( f )^(0 
- AC /). 如果微分这个恒等式，便得出 ' 

k \ t ) = （ f ) A ( f ) j .( r ) 十，（，）‘4’（（）丄（0十 y 

但是，因为 A ( f ). r (?)=； l ⑴. Hf ) 和， ( f ) A(;)=A ⑴， < f )， 这就变成 

A ’（，） = + y ' } -f (f) ( f}jr(r J — y ' (f )A'(f) 

我们已经用到了恒等式 (6.3. U ). 在； = 0,这在正规化条件， j :=1 和 V j = 1 下，正好是恒 
等式 A '(0)= yA \0). r . 如果』 和 y 是右 A 特征向量和左 A 特征向量，它们不一定用1:述方式 
正规化.可以用代替^用来得到一般的恒等式 A ' C 0 )，_r = 
y \ A r (0). t -, 至此 G 经证明/关于矩阵 A 的下述结果，它不耍求 A …定可对角化. 


6.3.12 定理设 AU )6 JW „ 在〖=0可微.假定 A 是 A (0) 的代数单重特征值，并且假定对小的 
t , A ( f ) 是 / Ur ) 的特征值，11使 A <0) 二 A . 设工是 A 的右； I 特征向 M , . V 是 A 的左； I 特征向 
董 ，则 


练习 

在 f = 0， 


乂 ’（0) = 


y a' (O h. 

〆 j ' ‘ 


设 / Ui ) = A + ft \ 其中£是固定的扰动矩阵，（在定理 （6.3.12) 的假定下）证明， 


练习 


山 — ， 


在定理 (6. 3. 12) 假定下.证明，对任意 


而,， y ' . i ' - 


这个公式说明，相对于 A 的任一元素的变化， A 如何变化. 提示： 设 E = E „， 它是矩阵， 
II 其仅有的非零元在)位置上. 

练习考察矩阵 a=D 如果 e 关0,特征值；就是单里的.对所有四对，， j ， 


wm 


直接算出当 £ -*0时，这些变化具有什么性质？由此可知，如果.接近 FF 交.那 
么.对于 A 的某些扰动，特征值 A 可能是很叕敏的. 

与特征值的情形形成对比，仅仅因为矩阵元素的小扰动，即使是对角矩阵的特征向量，也 

可能会有很大的变化.例如，如果 t 匕?]，其中 e ， #0,则 A + E 的特 
矸值是 A = 1和 1+ E , 而相应的正规化特征向量是 
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刈于任意小的 $和1 通过适当选择之比，可以把第一个特征向量选定为任意方向上的 
点 Q 解. 

如果令 e =0, 则对任意 6^0. 被扰动矩阵 A + £== 2只有一个无丈的特征向量，而 A 
却有两个无关的特征向量. 

迄今我们的所有估计是艾于矩阵的扰动所引起的特征值误差的先 验界； 它们+涉及所计算 
的特征值或特征向景.或由它们导出的任何量.假定“近似特征向量和“近似特征值” i 已 
经用某种方式求出来，可能不是 A f 恰好等于; if 的情形，但是，当 A 可对角化时，可以利用 
剩余向—得到一 t 估计，确定 A 是如何接近 .4 的一个特征值. 
iEA-SAS 且假定 A 不恰好等 f .4 的任何特征值.于是 
r ^ ^ i = S(A — A/ )S _I 

所以 闶此， 

|| ill = || S(.A -XJr'^'r] <j|!StA-ii) 1 S 1 : | II r II 

4 |S_| |:s 1 r|(A—mi II r II =^SJ|M--AJ) Ml IM1 

=k-(S) I min I A, - A ■ j i| r || . 

从 [fif 



显然，即使当某个 A , 时.后一个不等式仍然成对于上述论证.已经假定 

( a ) iM 是 C ' t 的向量范数； j 

( b ) M ,, 上的矩阵范数 I *1 与 IH 相容： (6.3. 13) 

( c ) || D | = max I c/ r I i 如果 D 二 diagW, ， … ， ^J 6 M „ ； J 

U 条件数用矩阵范数 ||i •: j 来计算的.如果 A 抵正规矩阵，则 S 可以取为酉矩阵，乂如 
果采用~向 m 范数和谱矩阵范数.则有 w . s >= i . 条件(。)等价于要求矩阵范数 hi 是由单调向 
tt 范数 诱导的 [定理 ( 5. f ;. 3 ?}]. 因此，如果！ H 是 C " 上的单调向 M 范数，且 IHI 是由 HI 诱 
导的 M „ 上矩阵范数，则 (6.1 13) 的所冇条件都被满足.这样，就证明了关于后验界的结果， 
它与定理 （ G . 3. 2) 和推论 (6. 3. 4) 具有相同的形式. 

6.3.14 定理设』是可对角化矩阵，且 A^SASdW A = cn a g ( A t , A „). 设 C " 上的 

向范数 HI 和 M „ 上的矩阵范数||_ i | 适合条件 (6. 3. 13), 设 , feC " 是给定的非零向 M , A 楚给 
定的复数，则存在 A 的某个特征值 A ,, 使得 

U-A, Klslliils- |||^ = «(5) yj' (6.3.15) 

II ^ II II ^ |1 

加粜 A 是正规矩阵，则存在/ V 的某个特征值使得 
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这后一个结果可能不同于线性方程组的解的相对误垄的后验界的相应结果.如果线性方程 
组的系数矩阵是病态的， （5.8. 11) 说明，小的剩余向量并不蕴涵解的小的相对误荖.然而， 
(6.3. 16) 却说明，如果 A 是正规矩阵（实际上， A 通常是 Hermiu ■矩阵或实对称矩阵），又如 
果近似特征向量 ----- 特征值偶有小的剩余向量，则可以保证特征值的绝对误差是小的；没有条 
件数出现在界中. 

这个关于特征值的惬意结果没有关于特征向量的类似的愜意结果相匹配.即使对于实对称 
矩阵 t 一 个小的剩余向 ft 并不保证近似特征向量接近于一个特征向量.例如，考虑 A == 

J ], e >0. 如果取 A = 1 和；=[1, 0]' 则剩余向量是「=[0, e ] T . 对所有 e >0, A 的 

特征向是 [u 1] T 和 [1, - W ， 闹不论^如何小， i 不近似平行于这两个向量中的任何 
一个. 

练习证明上述例子中 A 的特征值是 l + e 和1 一 并且验证在这种情形下的界 
(6.3. 16). 

习堀 

1.如果 A , ^是 A 的特征值，且 A 关&证明 A 的相应于 v 的任一左特征向量与 A 的相应 
于 A 的任一右特征向量正交. 

2- 在 A 有互不柑同的特征值的假定下，利用上一个习题给出引理 （6.3. 10) 的另一个证明. 

3.考察 


L e 0」 Lo oJ 

其中 e >0, 试验证本节第一段最后一句话中所表现出的遗憾.证明，对 £>0, 次可对 角化， 
且八的 .- 个特征值与 A „ 的每一个特征值间的极小距离是/ £ . idA - A . + K . 并证明 
1)1:1 1 一 ， 若 £ —0 

因此，-般说来，没有形如 I h - A , ! 的界可能是正确的.然后计算在这种情形下定理 

( S . 3.2) 的界，并且说明会出现什么情形. 

4 . 考學 多项式= (x — j 、, -它在有重根，即/ > U .,」 ）= 〆 (/',) = 0， f 0. p r ， (. j -,,) =0. 
证明，对‘小的£>0,有形如 xnis 12 与心接近的两个根.因此，一个多项式的各个 
系数中阶 s 的一个改变就可以使它的各个根按阶 f 的一个相当量发生改变.对于一个多项式， 
一个零点的扰动与各系数的扰动之比可能是无界的. 

5. 考虑界 (6. 4), 它是说，对于 Hermite 矩阵(或更一般地，正规矩阵），特征值的扰动 

与矩阵诸元素的扰动之比是有界的.因为矩阵的各特征值正好是其特征多项式的各个根.解释 
为何这个合意情形与习题 4 中的结论是-致的.历史的经验是，按传统习惯去构造特征多项式 
然后求它的各根的方法来计算 Hermke 矩阵（或任何其他矩阵）的各特征值是不可取的.这有可 
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能把原本良态的问题转为病态问题！ 

6. 考虑 Givens 给的例子，设 A = i 是 2 X 2 实对称矩阵，而 


ECe) 


「 ecos(2/e) 

Lesin(2/e) 



£ > 0 


是一个实对称扰动矩阵，且 E (0) 三 limE ( e )：-0. 证明 ， A + E ( e ：> 的特征值是 1+ e 和] — e ， 而 

F-tJ 

A +£( e ) 相应的（唯一确定到相差一个 符号） 的正规化特征向量分别是 「 TOS ( l / e) , sinUA )] T 和 
[ sin ( lA )，- C o S ( l / £ }] 7 , 其中 f >0. 证明，.当0时，每个特征向 M 可随意地指向任一给 
定的方向.因此，即使我们仅考虑实对称矩阵，如果它的特征值与其他特征值没有明显的区 
别，则有个别特征向量可以快速地变化. 

7. 试用定理 < S . 3. 5 )的证法证明，（在该定理的假设条件下）存在整数], 2,…， n 的一个 
排列 r ， 使得 


(2 lA . n - A , \ 2 Y ' ： > l | F || z . 

r-l 

提示：考虑 mm 彳2 Ke ( A [ A ,) ： C ^ (_ c J; ] 是双随机矩阵 

<-j= i 

8_ 设 .46 M „ 是给定的正规矩阵.其特征值集为 U , ( AM , 又设 r >0 是给定的，且定义 
S ( A , r ) = { D & M„：B 是正规矩阵，上 i |l B-A || 2 sjr } 

证明，…，是矩阵 ses ( A , r ) 的特征值集合当且仅当 

m in { ^ | A ,( A ) — A „ (I > I 2 :tr 是 1 ，…， n 的 一 个排列 

r l 

这给出了一个给定的正规矩阵的邻域中的诸正规矩阵的可能特征值集合的完整特征.提示：必 
要性用定理 (6.3. S ). 关于充分性， 设 / l ^ tMLr ， 其中 vl = di a gU ,( A )， …， A „( A )), 然后定义 
B = UAU ' . 其中必一 diagd …， 夂）. 

9. 在定理 ( S .3.5) 的证明中，用到了如下事实：如果 [/ = [心] 是酉矩阵，则 Ae 
[丨 S I 2 ]是双随机矩阵.说明不是每个双随机矩阵可以用这种方式由两矩阵产生.提 示：考 
虑例子 


p ] 0" 

I 1 ° 1 ' 

0 1 1 _ 

10. 假定是给定的 Hennite 矩阵，且假定用某种方式已求得一个酉矩阵 L ；， 使得 
" 3. 05 - 0. 06 0. 02" 

UAW - -0. 06 —6.91 0.07 

. 0.02 0. 07 8. 44_ 

对于4的特征值，给出你所能做到的最佳估计. 

11- 不能指望非正规矩阵有形如 （6. 3. 4) 的界.考虑 A , 其中， 
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“0 … 0」 

证明 A 的所有特征值都是0,而 A + E 的特征值是.关于7^的》个不同的值.无论 £ >0为何 
值，只要适当地选取〜就可使 A _ f £ 的所有特征值任意大.当4是正规矩阵时，情况有何 
不 

进一步阅读 '定理 （6. 3. 5) 的原姶形式可参看 A . J . Hoffman and H . Wieiandt . “The 
Variation of the Spectrum of a Normal Matrix ," Dui ? Maih . J . 20(1953)，37-39. 这个结果 [377] 
关屮实对称情形的一个初等证明见 「 Wil ]， PP . 104-109. 

6.4 其他包含区域 

我们已经比较详细地讨论了 Gersgorin | Ml ^. 它们是 T 面上一 类特殊的容易计算的区域， 

这些 K 域保证包含给定矩阵的各特征值.许多作者也许受 ( iersgorin 理论的优美几何结构的启 
发，推广 r 这个理论的思想和方法，得到一些其他类型的包含区域.我们讨论其中几个已经成 
熟的富有恃色的结果. 

第一个结果给出 f 特征值的包含区域，像 GerSgorin K 域那样，它是若干个圆盘之并，不 
过，圆盘的半径既依赖于去心行和也依赖于±.心列和. Gersgorin 定理的分离行和与列和形式 
是作为这个结果的极限而得到的，这个 结果归 功于 Ostrowski , 闶此它可以看成安插在 (6. 1. 2) 

与 （ fi . L . 4) 之间的包含区域的一个闭联集. 

6.4._1定理 （〔) strowski ) a - A - fajeM ,,, a 6[0, 1] 是给定的数，又设 ft : 和 C : 分别表示 
A 的去心行和与去心 列和： 

矿=_^丨 <0 (6.4.2) 



则 A 的所有特征值位于《个圆盘的并 J；， 

U uec；l Kft ：« C； r "} (6.4.4) 



屮. 


证明： 我们可以假定 0< a < 1, 当 a = 0 和 a = l 的情形（相应于关于列和与行和的 
GerSgorin 定理） 町以通过取极限得到-另外，可以假定所有因为可以在其 J ?; =0的任 
一行中添上一个小的非零元使 A 产生 扰动； 所得到的矩阵有包含区域 (6. 4. 4)，它大于 A 的包 
含 IX 域，并 H . 在扰动趋于零的极限情形推出结论成立. 

现在假定 H . x = U ]#0. 干是对每个 ; ' =1, 2,…， n , 有 


I a - 11 X, | = | |< 2 i i i ^ i = 2 t I i !_ " I I 

厂丨 ；-1 

jVi 

< [Sn « 0 if ]-[ 土 “ r° u- ir 1 叫 1 、 

；-] 

i-Ai )-f-\ 


(6.4.5 a ) 


: uju i 1 " 1 °T.' 


W 为 i ?:> o , 它等价于 


因而 


I A — a r , 


^ I 1 <[写 Ih IU r 叫 1 


[ I I - I ' I 1 ] < 土 u 卜,丨… 1 (6.4.5 b ) 

在 ( S . 4. 5 a ) 屮所使用的不等式是 Holtkr 不等式（附录 B ), 其中 ， f = l / a 且 9 = f /(/>— 1 ) = 
l /( l - a ). 现在对；相加 （6. 4. 5 b ) 便得到 


St^] 1 


1 al <SS I 〜 iu r "" 1 

广 1 

= Sc ； I ^ I 1 ' 11 ■*. 


(6. 4.6) 


如果对适合 i 关 0 的每个^有 


则 （6. 4. 6) 不能成立，因此，得出 


〶 r ，> 匕 
[ ]< C : 


对适合 A ，0的至少一个，值成立，因而 

I A -«„ KRl - C ： 1 □ 

练习考虑 A=fj j ， 试比较 GerSgorin 行和列特征值包含区域与 a =>0_ wsi 区 
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域.对于 A 的谱半径， Ostrowski 定理给出什么估计，且如何同 GerSgorin 估计 （ 6. 1. 5 ) 进行 
比较？ 

练习推论 （6. 1.6) 的 OsTrowski 形式是什么？ 

下一个结果也是 GerSgorin 定理的推广，它属于 Brauer , 不过现在一次要取两行；几何区 
域不再是圆盘，而是称作 Cassini 楠圆形的诸集合.显然，其证明平行于 Gerggoriti 定理的证 
明，其中不仅选择特征向量的一个最大模分量，而且还选择两个最大模分量. 

6.4.7 定理 ( B raU p 「）= A 的所有恃征值位于 n ( n —1)/2 个 Cassini 椭圆形 

的并 

(J U 6 C ： | z — a „ 1\ z - an } (6. 4. 8) 

■•i-i 
味 j 

中. 

证明： 设 A 是力的特征值，且假定 A.r = A _ r , 其中尹 0. 则 _ r 的一个元素有最大绝 
对值，例如心，使得对所有（=1，…， n 有 | 心丨> | 1 | 且心尹 0. 如果的所有其他元都 
是零，则的假定说明因为 A 的所有对角元都包含在区域 （6. 4.8) 中，所以， 
当它的相应特征向量 H 有一个非零元时，特征值 A 在这个区域中. 

现在假定至少存在特征向量 _ r 的两个非零元，设 a 是具有第二个最大绝对值的 分量； 即 
对所有；=1，…， n , i 幸 p , 且 有丨心 | > | ; | > | _ r , 1 . 

于是 Ax = Aj - 表明 




它蕴涵 


或 

但是也有 


I j, II A - a,,. I = ] ^ap,Xj j «£ 2 \ <i pj I I -T, f < 2 a pi i I I = ^ I J", 1 , 

J - 1 厂=丄 / = i 

j 本 P jifi Mfi 


I A — t< Rp 


I a r 


(6.4.9) 


j ： q ( X - a ^) = XX〆 ， 


它蕴涵 


I A II A — 〜 | = I |< >] I M j-j ]< ^； j M ^ l-J ?； [ ^ j, 


I 卜以喷 j . 

取 {6. 4. 9) 和 （ S . 4. 10> 的乘积使我们可消去 _ r 的两个分量的未知比，从而得到 


(6, 4, 10) 
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I A - I I A K "K4 = KK- 

丨心丨 I ^ v I 

闲此， 特征值 A 位 厂_ 区域 《. 4.8)屮. □ 

练习 Brauer 定理的列和形式是什么？ 

关于特征值包含区域的任一个定理蕴涵（并且实际上也被蕴涵于)相关的可逆性定理.现在 
利用包含结果得到不许^ = 0属于该包含区域的条件. 

6.4.11 推论如果 AzhJeM,,， 则下列条件中的任何-‘个都是 A 为可逆矩阵的充分条件： 

(a) 对某个 [0, 1] ■ | | "对所 有/二1，…， w 成 S:(()strowskii) ; 

(b) U, I I >尺» 对所有 », ¥;■ 成立 (Brauer). 

练习利用 （6-4. 1) 和 （G. 4. 7) 证明 （6.4. ]1). 

Bnmer 定理要求一次取两行的乘积.在一次取二:行或多行的想法启发下，人们注意到进一 
步推广 linger 定理的可能性，并且对每个== 1，…，》，考虑形如 

{z ^ C •- J| | : — a Vt <11^^}' A = [a,；] G M„ (6. 4. 12) 

卜 1 t - 1 

的集合之并.对每个 m , 有个这种形式的 集合 ： w = l 给出 niGerSgorin 圆盘，而 m = 2 

给出 Brauei ■的 -1)/2 个椭圆形‘遗憾的是，对 m >3, 集合 Cfi. 4. 12) 并不一定是特征值包 
[30 含区域，正如例子 

「1 10 0—1 


[.0 0 0 1」 

所说明的那样.对于 = 3 和 m = 4, 集合 （6. 4. 12) 在点^ = 2完全失效. 

练习证明 （6. 4. 1 S ) 中矩阵的特征值是 A = 0, ] , 1和 2. 对 m = l , m = 2 和 m = : i , 4画 


出集合 （6. 4. 12) 的草图.考虑 

rj o 1 

-L » tfi L4 -TH ffl \i t 寸 uy 

厂1 11 

廿 hl-l I _ 1 oir 1 

‘ H 。 J eM - 

(6. 4. U ) 


其中， J ] eM ^ 且 teM „ 是单位矩阵，证明，对所有 m >3, 也会出现上述同 
样的现象. 


虽然这个例子排除了对 B rau « 定理作最明显的推广的可能性，但是它提醒我们，什么样 
的推广可能是错误的，应如何对待.区域 (6. 4. 12) 的问题在于采用了过多项的乘积，其中一些 
项因为零去心行和而有可能为零.当然，如果矩阵 A 是不可约的，这种情况不会出能现；这 
时所有圮 >0. 

然而，即使 A 是不可约的，区域 （6. 4. 12) 还可能不是4的特征值包含区域；它仍然可能 
采用很多项的乘积.考虑由 
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连通的，且人是不可约的.于是求得 

R \ - 1+2 £ , R [ = l , R \, = e , R \ = £ , 

& A ( 有特征值 

A, = 1. 1, 1 + (1 和 1 一 （】+2^) 12 . 

练习验证关于 4 的上述计算. 

因为-:项或多项圮的任一乘积至少包含 e 的-个凶子，所以，当 e 是小的正数时 ，无论 
对于 m = 3 还是 m = 4 , 集合 （S. 4 . 12) 都不可能是特征值的包含区域. 

练习考虑（6, 4. 14) 的如同形式 （6, 4. 15) 的扰动，证明上述结论对所有 m >3 成立. 

〔6 . 4 . ! 3) 和（ 6 . 4 . 1 5) 的哪个固有性质说明，》1 = 1和/?1 = 2在（6.4.12)中是可行的，而 m 
二3和 m = 4 是不可行的呢？ Richard BruaWi 注意到，在每种情形下有向图都不包含长为3或4 
的 N 路，但是的确包含长为1和2的 M 路.这原来是得到 Brauer 定理的庀确推广的关键所在. 

我们知道，有向图 r 是强连通的，当且仅当在 r 中有条从每一结点到任何其他结点的冇 
向道路(并 £J. 坯有返 W 的有向道路). 

我们称 r 是弱连通的，当 R 仅当从每个结点到某个其他结点有一条有向道路及返回的有向 
道路.这等价于断言， r 中的每个结点属于某条非平凡 ® 路； •条平凡回路（或圈）是长为1的 
有向道路，其起点和终 点在间 -个结点. 

用矩阵来描述，我们知道，是强连通的，当且仅当 A 是不可约的.称4是弱不可约 
的，当 ri_ 仅当 rcA：) 是弱连通的‘弱不可约性看米不像不可约性冇引人注意的特征描述[用像置 
换相似那样的变换表示 ( 6.2.211^]，但是，用 A 元素的零-非零结构来描述便会得知， A 是弱 
不可约的，当且仅当对毎个；--1,…， h A 的第 ; ■行至少有.一个非零非对角元，使得/\冇 
一个非零元序列…，气人，适合赵和这个麻烦的条件大约是/!有 
性质 SC 的条件 (6.2. 7) 的一半，为 r 汁算上的甫要，或许用类似于定理 2. 23) 的形式来叙 
述更为方便. 


6.4. 16 引理如果 ASM ,,， 则 A 是弱不可约的，当且仅当矩阵 

( a ) B =[7+ I A I :卜 1 或 

(b) B=U + M(A)y-' 

中的任 何一个 冇性质 ： 对每个/=1，在第/行至少存拃一个非零非別角元~ 0 .关 n ， 
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使得~也是非零的. 

练习证明引理 (6. 4. 16). 提示：利用 （(5.2. 1S) 中的思想 

练习假定 A&M a ，设 B&M,, 定义为 （S.4.15) 中的 （a) 或 （b). 证明， A 是弱不可约的当 
且仅当 r(s) 有 性质： 每个结点属于长为2的回路.关于不可约矩阵的相应性质是什么？哪个 
性质更弱？根据定义可知，一个回路是简单的，如果只有它的起点(这也是终点）在结点表中可 
以出现两次以上. 

练习如果 Aeiw,, 是弱不可约的，证明所有杧>0和所有 C:>0. 

集 s 上的一个预序是定义在 S 的所有点对之间的关系 J；， 使得对任一対元素 s , 有 

A? 或 / Rj , 或者两者都成立-一个预序一定是自反的 （ s fi s 对每个 S es 成立）和传递的（如果 
且戊 《，则 iRa). —个预序可能不是对称的（只要/ 办， 就有 A/)， 而且还可能有 J 沿且 
tR ^ 而无 J=f. S 的子集 S fl 中的点 z 称为的极大元，是指对所有 ses 成立. 

练习设 S 是复数域的任一非空集合.用 

与且仅当 | s ： 丨<|如 | 

定义的复数对〜 w es 之间的关系 jic 上一个预序. 

6. 4 . 17引理设 S 是非空有限集，在 S 上定义了一个预序-则, S 至少包含一个极大元. 

证明： 把诸元素排成任意顺序.，… ，〜， 令 m 如果就留下 s ， 否则就令,-= 
_ »对余下的元素继续这样做. s 的最后值就是极大元. □ 

如果 r 是有向图， ap 是 r 的一个结点，定义1^(乃）是由不同于乃的结点组成的集，且 
从 f, 经长为1的某条有向道路可以到达其中每一个结点，注意，如果 r 是弱连通的，则对每 
个结点 fler，/ vr ) 是不空的. 

让我们用 c ( a ) 表示有向图 r(A) 中的诸非平凡回路 y 的集合.一条非平凡回路是至少包含 
两个不同结点的 回路； 即它是（简单有向）回路，而不 是圈. 对于矩阵 （6. 4. 13)， C(A) 只包括 
一条回路7=6^， Pj - Pi - 而对子矩阵 （6. 4 . 15)，则有 三条 分离的非平凡回路，其长度都 
是 2. 

6.4.18 定理 (Brualdi) 如果 A = [\]eM„ 是弱不可约的，则4的每个特征值包含在区域 

U {= € C： JJ | |< JJi?； } (6.4.19) 

吒⑽ P^y p^_ y 

中.记号是说’如果 y=AP :; ，…， 是非平凡回路 ， ^ Pit - P：i , 则在 (e . 4.19) 中的 
每个乘积恰好包含 A 项，且下标^取/,， ； *这々个值. 

证明： 假定 A 是 A 的特征值，且对 .4 的某个主对角元有 A 则 A 显然在区域〈6. 4. 19) 
中‘实际上，因为 A 是弱不可约的，所以所有及:>0，因而在这种情形， A 位于区域 （6. 4. 9) 
内部.如果 A 的每个特征值都等于 A 的某个主对角元，则 A 的所有特征值都在区域 (6 . 4 . 9) 的 
内部，于是定理得证. 

关于其余情形的证明，假定 A 是 A 的特征值，且对所有, =i, x ^ a „. 设 Ar = ；Lr 
对某个非零1 成立.在 r 的诸结点上定义预序 J； 为 

PMP ,, 当且仅当丨 』.， |<| a I . 


(6. 4. 20) 
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要证明，在 r ( A ) 中存在回路且具有以下二:条性质 ： 

( a ) Y ^ P . P ：,- P , ; P ： 3 , -： 非平凡(简单有向）回路， 

其中力>2且 p Vi = p , t . 

( b ) 对每个 j = l , •+•， I 结点尸，…是 厂外（/\)巾的极大 结点； 卜 （6.4.21) 

即 I > I 对所有使 ( f \ )的 m 成立. 

Cc ) 所有 & 关 0, i = l , k . 

如果/是适合条件 ( e . 4 .21> 的 HI 路，则 A _ r = A _ r 推知，对任意 J = l , …， I 有 






因而 


I a - «, A 11' 卜 I 2 N S u I 丨 
wv w'' 1 

< S IV 11 I 
U ,., i . 

如果现在在/的所有结点上取不等式 (6. 4. 22) 的乘积，便得到 

IT u — v, n' [-, +] i. 

- ? = ] / = I 

但是 


食以― “，丨和 ns ； = jir % 

又因为 /^广矸， 还有 ~ 因此， ; 々 

n I' i = it II 关 。‘ 

j =I 

于是，用 （6. 4. 24) 除 (6. 4. 23) 便得到 


(6. 4. 22) 


(6.4.22 a ) 

(6.4.23) 


(6. 4. 24) 


IT I A _a„ JJi?:. (6. 4. 2S) 

W Per 

因为/是 r ( A ) 巾的非平凡网路，所以特征值 A —定位于区域 (6. 4. 〗9)中. 

现在应该证明，必存在适合条件 (6. 4. 21) 的冋路 〆 -设; •是使 I 关0的任一下标.于是从 
恒等式 


( Ai , 山.= 2… 〆 ” 

以及和 A —〜蛘 0的事实得知，左边 if ： 零， W 而在 (片） 的诸结点中[这些只 使〜关 0 
且因为 r ( A ) 是弱连通的，所以/\(尸）非空] 一 定至少有一个结点，使得相应的特征向 
量分量々非零‘设尽三尸，又段/^是/^巧夕中的诸结点中的极大结点，即 u , 2 丨> | | 

对所有使 p, a e IV ( & ) 的 m 成立.我们可保证 '关 o . 
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假定上述构造法己经得到长为 j — ! 的有向 道路卩 p , p ,. p ,_, p ,, a 适合 

( G . 4.21)的条件（1:)和（ £ ) ; 刚才已对）= 2这样做广于是 ' 

(A … a '。） 』';二 

1 ' ; 

且左边非零，因而在 A h ( p t[ )t -定至少#在一个结点 L 因 r ( y \) 是弱连通的，所以心（/\)非 
屮]使相应的特征向鼋分量非零.因此，如果选取 r lfl ，为/ \( P V ) 的极大结点，保证有 Ad 

判. 

因为在 HA ) 中只办有限多个结点，这个构造法依次取 J = 2, 3,…，最后会得到第一个 
极大结点/它是作为前面某-步的结点 P v 得来的<2€户+1<^).因此/= 
p - f p v , r p v^ p ' f -r -• P Vl P ,„ 是 rw ) 中的回路，且适合 （6. 4. 21) 巾的所有三个条件. 口 
当 A 实际 上是不 可约的时候.扮 ualdi 定理有较强的形式，它是推广 BraueHU 7) 的定理 
( fi . 2. 26) 的形式. 

6 , 4 , 26 定理 （ Brualdi ) 设 -4 = [ 〜] 6 A 1 是不可约的.则对每个非平凡回路 yeC ( A ), 只有 
当各个集合 

e C ： JJ U - K Jin ',) (6.-1.27) 

f；e r rt r 

的边界都经过 A 时， K 域 (6. 4. 19) 的边界点 A 才可以是 A 的特征值. 

证明：因为所有 R :>0, 如果对任一， 一 1, 2， …， ri 成立，则 A 不可能作|乂域 
(6. 4 ‘ 27) 的边界上. W 此，可以假定，对所有）一1，…， 7 , A /■ a a , 并 fi 可以继续采用 
Bruald . 定理 ( S . 1. 18) 中的证法以及相同的记号 . f 日是 需另外假定 A 是域 （ S . 4. 19) 的边界 
I :-的 A 的特征值.正如在引理 （6. 2.3) 的证明中所证明的，对所的有非平凡回路 yeCXA)，A 
必定满足不等式 


n a ）ik 

! ：^y 

iMl 「其中等式对至少一 t yer ( A ) 成、 >:]. 把这个不等式与 （ fi .4.25) 作-.比较，得知 

II 卜 1 二 ]I R - ' (6.4. 28) 

r : e ， r ,, r ' 

其中/是在 （ S ‘ 4 . 18) 的证明中所构造的特殊凹路. 因此. （6. .1. 23>中的不等式一定是等式，从 
曲对所有7 = 1， 2. k , ( S . 4. 22) 中的两个不等式一定是等式.特别是，不等式 （6. 4. 22 a ) 
一定是等式，因而对每个 f 〆 和对所有使 PG ( P ,,) 的 m ， | _T,„ | = j . r , ^ ^ = 常 

数.汗意，这个结论对适合条件 (6. 4. 21) 的任一回路都 i 、〉:. " l 

现在定义集合 

K = | 6 r < A )：\ . im I - r , =常数对所有使尸,„ e 厂外 （ 尸） 的 ™ 成立 }. 

H 为/的所有结点都在 K 屮，所以 K 不空.我们想要址:明 HA ) 的所有结点都在 K 中. 

假定 r ( w 的结点 p , 不在 K 中.因为 r (/ n 是强连通的，所以在 r (*4) 中，从 k 的每个结 
点到这个外结点至少存在一条有向道路.如果从所有这些有向道路中选 取氏度 最小的道路’ 
则它的第一条弧一定是从 k 中的一个结点到不在 k 中的结点的弧.如果在 r ( A ) 的结点上 
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采用定理 4. 18) 的证明中用过的相 N 预序，则可以使用在定理 ( S . 4. 1 S ) 证明中用过的相同构 
造法；从结点 p 卢 ' 开始，选取极大结点 LeiVh ), 选取极大结点如 
此等等. W 为 r ( A ) 是弱（甚至强）连通的，所以，在每一步非空，乂由于如前所述的 
相同理由.极大结点适合 (6. 4. 21) 的条件 ( C ). 

如果在这个构造过程屮的某一步，在选取极九结点当中，可以选择在 K 中的或不在 K 中 
的结点.那么就总选取不4: K 中的那个结点.如果在任一步中.可供选取的所有极大结点都 
在 K 中，那么就在它们中任选一个，然后沿着（一定在 K 中的）长度最小的有向道路到不在 K 
中的第一个结 点上； 并 fl 如前继续选择极大结点.根据 K 的定义， K 中任…条有向道路将具 
有 件质： 每个结点是它的前一结点在 Af 中的极大结点 [( G . 1.21) 的条件 （ b )]. 因为 K 的补集 
只有冇限多个结点，这个构造法终究应该得到 K 的补集中的第一个极大结点，它是作为前面 
某一步的一个结点得来的.对于这个构造法中的这个结点，在它第一次出现与苐二次出现之间 
的有向道路将是一条非平凡的有向回路 t 这条 有向回 路町能不是简单的，这是因为当这个构造 
法选出 K 屮一结点时，我们就选一条由该点到 K 外一结点的有向道路. 在位于 K 中的那部分 
道路中，可能有有限多条回路，但是可以删 S 它们而留下一条简单回路/, /适合条件 
(6.4. 2]) 且至少包含不在 K 中的-个结点. _ 

因为凹路/迅合条件 (6. 1.21). 所以可以用它来代替定理 (6. 4. 18) 证明中的回路根据 
本证明的第一段中的论证，得知，对所有 I | = r , =常数对所冇凡,,6厂(1\)成 
'/：. W 此/屮的毎个结点在 K 中，这与/至少包含4、在 K 屮的一个结点相矛 fg . 这就证明了 
厂 ( AM 、 可能有不在 K 屮的任何结点. 

如果 y 是 r ( A ) 中任一条非平凡(简单有向） 凹路， LAj 为它的所荀玷点都在 K 屮，所以它自 
然适合条件 （6. 4. 21). 因此可以用它代替定理 （ fi .4. 18) 的证明中的 /. 从而也可以用它代替 
(6. 4. 28) 中的 〆 . 这就是所要证的结论：每个集 （6. 1.27) 的边界经过 A . 厂1 

6.4.29 推论 如果 A 6 M ,,. 则 K 列条件中的仟何一个是 A 为可逆矩阵的充分条件 ； 

( a ) A 是弱不可约矩阵■且 

TT I ^ i> IIr ： 

/:0 >*6 ) - 

对苺条非平凡回路％ 「( A ) 成立； 

( b ) a 是不可约矩阵 ， a 

IT U b IK 

J；f 7 /；e y 

对每条卄平凡 l ?! 路成立，其中严格不等式对至少一条回路成立. 

习理 

1. 证明，如果矩阵 A = r «,1 适合关于 Bnmcr 可逆性的条件 （ fi . 4 . ]1 h ), 则除了 ； = 1，…， 

”的 辛:多一个值以外.都有 i 心 ， I > R ：. 因此，：■条件只是比关于严格对角占优性的 
Levy - Desplanques 条件 （ fi . 1. 10 a } 稍微弱一些_这与 （6. 1. 11 )是什么关系？ 

2 . 证 明，根据 （ 6. i . 11 ) 中的两个条件 ， A = ^ D 都是可逆的，不过不是 Levy - 
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Desplanques 条件 （6. 1. 10 a ) 也不是 （6. 1. 11) 确保其可逆性 .（6. 1. 11) 的列形式是什么？ , 

3. 证明，对于每个不可约矩阵 A £ M a 是弱不可约的.试给出一个例子，它是弱不 
_ 可约矩阵而不是不可约矩阵. 

4. 给出推论 (6. 4. 29) 的证明细节. 提示： 采用 （6. 1. 10) 和 (6. 2. 6) 中的相同证法. 

5. 证明，八云^1是弱不可约的，当且仅当 A 不置换相似于其一个对角子块是 1 X 1 的分 
块三角 （0. 9. 4) 矩阵. 

进一步阅读 关于包含区域的详细说明以及许多原始文献可参看 R . Brualdi , - Matrices , 
|39 Q | Eigenvalues, and Directed Graphs,"Lin. Multilin . Alg , 110982；, 143- J 65. 



第 7 章正定矩阵 


7.0 导引 


一类具有特殊正性的 Hermite 矩阵常常出现在仵多应 用中. 具有这种正性的 Hertnite 矩阵 
(特别是实对称 矩阵》 可以看作正数_念到矩阵的推广.这样考虑常常可以深人理解正定矩阵的 
一些性质和应用.下面给出这方面的一些例子，其中就要出现这些特殊的 Hermite 矩阵. 

Hessian 矩阵，极小化和凸性 

设 / U ) 是某 K 域 DCR " 上的光滑实值函数.如果 y = b ,] 是 D 的一个内点，则 Taylor 定 
理说明， 


+ ( n ) 。厂力 ) | ' + … 

对 3 >附近的点成立，如果 y 是/的临界点，则所有一阶偏导数在 tV 点为零，因 1 而，关于 
/在^附近的性态，有表示式 


/U) - f(.y > -公 “ -X)(A -x) H 

= U-y 厂 —W + …， 


iXn 矩阵 




-行 

. dXj 




称为 / 在 j 点的 Hessian 矩阵； 因为 / 的混 S ■偏导数相等，所以它是对称矩阵.如果二次型 
x T H(f ； y)z, 6 R" ( 7 . 0 . 1 ) 

总是正的，则 y 是/的相对极小点，如果这个二次型总是负的，则 yji / 的相对极大点.当 
然，如果这个二次塑对所有非零可能没有确定的符号，在这种情况下，临界点^的性质 
就不确定.在》= 1 的情形，验证相对极小点或极大点的这些准则不过是通常的二阶导数检验 
法‘ 对于》= 1 ，第=种可能性只在拐点出现；当 《>1 时，情况可能要复杂得多. 

如果 二次型 （ 7 . 0 . 1 ) 在 D 的所有点（不 R 是在/的临界点）非负，则/是 D 中的凸函数.这 
是《 = 1 的熟悉情形的直接推广. 

方差-协方塞矩阵 


设& ，不，…， X 是在某个具有期望函数 E 的槪率空间上的具有有限二阶矩的实或复 
随机变量，且假定/^ =耵足）是相应的平均值.随机向量 X =( X ,， …，&广的协方差矩阵是 
矩阵 A =[ a g ]， 其中 

a tJ = E [( X , 
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W . 然， A 是 Hermite 矩阵，并 jl 容易算出.如果*= 6 C " ，贝 U 

s r A « — ^[ 2 z , ( X , - ",) 2 , （_ X , —",)]，土:?, ( X , ) I ^ 0, 

在这 t 结论屮所涉及到的^望函数的仅冇性质是它的线性' 齐性和非负件三个性质；即只要 Y 
是非负随机变量，就有 

不借助概率术语也可以作出同样的结论.如果在哀线上有一族复值函数.八，/=，… * 八， 
_ 如果#是实值函数，乂加果所有积分 

'二 J 7 I (x)/ J (.r)^(.j-)dx , …二 1， …," 

都冇定义且收敛，则矩阵 A = [“, ; ] 显然是 Herroite 矩阵.容易算出. 

d = 2 (" ^,,7,Cx)^/,(.f)^ C.r)d.r - [ I l 2 g(jr)d^. 

因此，如果 g (. r ) 是非负函数，则这个二次铟就是非负的. 

非负函数的代数矩 

设 / U ) 是单位区间[0, 1] 上的绝对可积实值函数，并且考虑数 

ai ^ j \ r */( J-)dr (7. 0. 2) 

序列⑷，…，…称为 Hausdorff 矩序列. H . 它自然与实二次型 

(7.0.3) 

有联系.如果令 A 二则 A 就是实对称矩阵，义如果对所有 .re [0, 1] 有/&)>0,则 
对所冇 2& R "' 1 , 将存这对每个^ = 1，2,…都成立，不论其二次型是否非负，具 
冇 A 的结构的矩阵（即元素〜，只是 /+ j 的函数)称为 Hankcl 矩阵.见 （0.9. 8) 节. 

非负函数的三角矩 

设 (仍是 [0. 2 d 上的绝对可积实值函数，并 R 考虑数 

夫 = 士 1 ， ±2, …. ( 7 . 0 . 4 ) 

J 0 

|扣引序列仏」 ，…， a - i , a z , a ..^ , …称为 Toeplitz 矩 序列， 并且它_然与二次塑 

'Za^z, Z, = 2 i,a z, z,f(d)Ae^ f " I fWAd (7.0.5) 

有联系，如果令 A 〜[ U | _ ; ]， 则 A 就是 Hermile 矩阵，乂如果对所有 3 e |_0, 2 tt ] 有 /( 们>0, 
则对所冇将有 〆 As >0. 这对毎个二1， L …都成立.不论其二次型是否非负，实 
有 A 的结构的矩阵（即元素\ 只是! 的函数）称为 Teopliu 矩阵.见 (0.9. 7) 节.事具上，对 
公忒 （7. 0.4) 稍加修改(其屮，非负测度 < 代替 /«) d ⑴，则二次塑 （7.0. 5) 是非负的，当且仅 
当 A 由修改后的公式得出 （ Bochncr 定理）. 

关于微分方程的数值解的离散化和差分法 
假定我们有形如 

— y"(jr) + ^ f(r) , 0 r 1 , 
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y (0) ^ a , 

3 <(i) =卢 

的两点边值问题，其中，《和戸是给定的实常数， /U) 和〆 .r) 是给定的实值函数.如果我们把这 
个 N 题离散化， R 只求〆&)气 V* 的值， k ^ Q , 1, «+1,又如果利用均差逼近导数项 

〜 +])/!)— 2 V (敁） 十 v(U--1)/1) _ 3 ^— 2:^ + 3 ^ 

LV(-r):= - 1 ~ = - 「— ]f * 

那么.就得到线性方程组 

nt 2 严-力 1,2,-,,, 


Vu ' 


A 


这早 .， 对于正整数 w 可以取 A = l/U+1)， y h = y ( kh ), a=a(M) 及 A—./ (从 ）* 可以把边值 
问题编人第一个 4 = 1) 方杩和最后一个 U = 〃） 方程而给出方程组 
(2 4- h 、） y' — y: = /i 2 /, 4- cr, 

— M -] + (2 十 /r cr £ )3-7 Vj., j = h ’ ft ， k = …， n — 1 ， 

— v^i + (2 + h 2 ( 7 tl ) y H — h 1 f ti +^ t 

还可以更紧凑地把它写成 A. V = 扣.其中 J = w=[V/i+a， h 2 f ” …， h 2 f ti J, 

且是一.对角矩阵 

[2 h ' 1 ai — 1 

- 1 2 十心 2 〜 —1 


- / r ( T „- 


0 


-1 

2 + iro„. 


(7. 0. G ) 


应该指出，不论 aU) 为何值， A 都是实对称三对角矩阵，但是，如果希荜 A. v =w 对右边任意 
给定的值都是可解的，那么必须对作某些限制以保证 A 是非奇异矩阵. 

容易算出相应于 A 的劣二 次坳： 


,r T A.r ^ [.rf -h (,r r - j- rM + x" ]+ /i 2 ^ 

等式 A 边中的括号内各项之和是非负的，且只有当 .r 的各分 tt 都相等，义都等于零时它才可能 
为零.如果则后一个和式是非负的，且 


『 Ajr 彡 [j; + 2 (毛 


4]5?. 0. 


( 7 . 0. 7) 


如果 A 是奇异 矩阵， 则存作某个非零向量 .iGir 使得 A J = 0, 因而 i T Ai = o. 另一方面. 
( 7 . 0 . 7 )中括 y 内 各项之和必定为零，山此推出 5 — 0 _因此.如果则矩阵 A 非奇异， 
且离敗的边值问题对任意边界条件 a 和/?都是可解的. 

这是在研究常微分方程或偏微分方稈的数值解时的典型情形.为了计算上的稳定性，最好 


國 





是设汁一种方法能把微分方程问题离散化，使得在所得到的线性方程组是正定矩 
阵.|〖[|当微分方稈是椭圆型时，通常可以做到这一点. 

在上述这些例子中所列举的矩阵具有特殊的正性，这正是本章要研究的对象.这些矩阵出 
现在许多应用屮：岡和分析中，复分析中，力学体系的振动理论中，以及矩阵理论的其他领域 
(例如奇异值分解和线性最小二乘方问题 的解） 中. 

习理 

1. 如果序列 w 是由非负涵数/通过公式 （7. 0.2) 产生的，证明 

… z ' z i 和 - a,..,.., 'tz.z, , 2 =" [s,] fe R " 

都是非负的. 〜 _l " J_l 

2. 用不意 图说明 Hankd 矩阵中哪些对角线取常值.对 To 印 litz 矩阵作同样的说明. 

3. 证明， （7.0.6) 中的矩阵 A 总是不可约的，乂如果则它是不可约对角占优矩 
阵.试用推论 (6. 2. 27) 证明， A 是非奇异矩阵，旦 .4 的所有特征值是正数. 

进一步阅读关于实 正定矩 阵的一个简短的综述可参看 C . Johnson , "Positive 
Definite Mfitrices /'. Amfr . Math . Monthly 77(1970), 259-264. 关于一般正定矩阵的其他综 
述以及有关这方面的大批参考资料可参看 （). Taussky , ''Positive Definite Matrices , " pp . 
309-319 of Inequalitivi , ed . O . Shisha，Academic Press , New York , 1967; 以及 
O . Taussky , 11 Positive Definite Matrices and Their Role in the Study of llie Cliaraclerititit 
Roots of General Matrices ," Arfww . Math . 2(1968), 175-186. 

7.1 定义和性质 

设力是以”出⑽心矩阵，如果对所有非零 C ■有 

. r'Ai >0, (7,1,1) 

则称 A 为正定矩阵. 如果 （7. 1.1) 屮所要求的严格不等式减弱成， At >0, 则称 A 为半 正定 
矩阵. 在这些定义不等式中隐含着这样的 事实： 如果 A 是 Hermite 矩阵，贝！ (（7. 1.]) 左边总是 
实数.当然，如果 .4 是正定矩阵，则它也是 t 正定矩阵. 

练习当 n = l 时.正定矩阵和半芘定矩阵意味着什么？ 

练习证明，如果叮对所有是实数，则/ V 是 Henniu ； 矩阵.因 
此 . A 是 Hermite 矩阵的假定在正定性定义中不是必不可少的.位是，-般习惯这样定义.提 
示： 把 A 写成 A =!?+/(:，其中和 C 是 Hermite 矩阵. 

练习说明，如果 AeM „ M 实矩阵，且对所有非零 iGR "， ，/兑1是正数，则 A 不一定 
是对称矩阵.因而它不一定是 IH 定矩阵. 提示： 考察实斜对称矩阵然后计算在 
这种情形 / At 是什么？对 T •非实/， ，.4 .r 乂如何呢？ 

练习证明 D U 是半正定的，但不是正定的. 

练习证明，加果 A = 是正定矩阵，则互=[\.]，#和 A 1 也是正定矩 

阵.提示：如果》5 = 1，则？ 
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类似地，可以对4定 义负定 概念和 半负定 概念，这只要把正定和半正定的定义中的不等 
式颠倒一下即可，或等价地，分別把一 A 定夂为正定矩阵或半正定矩阵.因此，关十负定矩阵 
的任何一个命题都对应正定矩阵的一个相应命题.如果一个 Hermiu ■矩阵不属于上面提到的各 
类中的任何一个丨即，如果 (7. 1.1) 左边既可取正值也可取负值1,则称它 为不定矩阵. 

关于正定矩阵，可以作出几个直接的结论，并且对十半正定矩阵，也有类似的结论. 

7.1.2 论断正定矩阵的任一主子矩阵也 是正定 矩阵. 

证明：设 S 是 {1. 2, …， 《!的真子集，且用 AfS ) 表示从正定矩阵巾划去其行号 
和列号分别为 S 的补集的若千行和若干列后得到的矩阵.于是， A(S) 是/\的主 f 矩阵， ft 所 
有主子矩阵以这种形式 出现： 我们知道数 det A(S) 是 A 的主子式.设是这样一个非零 
I » JM . 其中以 S 为下标的分量可取任意元，而其余分量为零元.设 HS ) 表示从中划去以 S 
的补集为下标的(零)分量后得到的向量，因而得到 

.HS).A(S).HS) = Ar>0. 

因为〆 S) 式0是任意的，这表明 A(S) 是正定矩阵. □ _ 

练习证明正定矩阵的诸对角元是正实数. 


7 . 1. 3 论断任意两个同阶 IK 定矩阵的和是正定 矩阵. 更一般地，一些半正定矩阵的非负线性 
组合是半正定矩阵. 

证明： 设 A 和 B 是半正定矩阵，又设因而对仟意有，十沾 ） _r = 

.多于两个矩阵的情形可按同样的方式 处理. 如果诸 系数是正的， A 
和 B 是正定矩阵，乂如果1是非零向量，则和中的每一项都是正的，所以诸正定矩阵的正线 
性组合 是正定 矩阵. 口 

W 此，正定矩阵的集合在所有矩阵组成的向量空间中是一个正锥. 

7.1.4 论断正定矩阵的每个特征值都是正实数. 

证明：设 A 是正定矩阵，设; leWA)， 且 J 是 A 的相应于;I的特征 向量. 经计算， J -' Aj - 
= J -'A J =A.r'x. 因此 J 二 （ rU/^x 是正数，因为它是两 个正数之比. □ 

7.1.5 推论正定矩阵的迹，行列式和所有主子式都是正数. 

证明： 迹与行列式恰好是诸特征值的和弓积，余下的结论可由 （7. 1.2) 推出. □ 

练习证明半正定阵的诸特征值，迹，行列式 和各: 式都是非负的. 

练习证明，" X”负定矩阵的诸特征值和迹是负数，但是，对于奇数„，其行列式是负 
数，对于偶数《，其行列式是正数. 

线习证明，如果為二 [«,,]£ M; 是正定矩阵，则叫〜〉 [a 12 I、提示：利用 det A> 

0. 证明，如果 A6M,, 是正定矩阵，则对所有/， J = l, 2, t 内， 

a„a }) >1 a v | 2 , 

证明，如果只假定 A 是半正定矩阵，则在上述不等式 *‘> ”必须换成_ 

7.1.6 论断设 AGAl 是正定的.如果 C6M ,, 则 /\ C 是半正定矩阵.另外， ran k(C. 

AC ) = rankCC ), 因， C+AC 是正定矩阵当且仅当(：有秩 m . 
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证明： 首先指出 ， C W ： 是 Herimte 矩阵.对任意工 6 C ' 有. 〆 广 A & — j " 知>0,其 
而不等式是从 A 的正定件推，屮,来的.十是， CTAC 是半正定矩阵.另外， A 是 TK 
定矩阵，所以得知. . r * CA (:. r >0 当 1 L 仅当 Cr 关0,只要能证明， C ’ = 0当且仅当〔,> = 
0,则关十秩的论断（因而 关于正 定件的论断）也将枏到证明，因为这将表明 e AC 和 C 有相同 
的零空间（因而它们也有相同的秩).如果 <>=0,则显然有 C '4 C / = 0, 反之，如果 
- 0 , 则， rM 〔>— 0 ,因而（如前，利用 a 的 ih 定件)得出 Ci '= o . n 

练习如果是半正定矩阵而不 是止定 矩阵，又如果 t ' eM ,,， 证明 CMC 总是半正 
定矩阵且不是正定矩阵.如果 C 6 M _, fl n ^ m , 用例子说明，即使 AGJW „ 是奇异矩阵， 
C :_ AC 也可能是正定矩阵. 

练习证明由正定（半正定）矩阵组成的锥在’相合下不变.见 (4. 5. 4). 

练习设 A 6 M ,, 是 Hermitc 矩阵.证明， A 是止定（半正定）矩阵，当且仅当存在非奇异 
矩阵使得 CK ; 是正定（半正定）矩阵. 

如果舍去 A 是 HermiteW 条件.并 fL 定义的二次铟 （7. 1. 1 ) 中 H 采用实变量.这会出现什 
么情况呢？如果/\是只-冇实 元素的 矩阵， IL ^ eR ' 1 , 则/ / Lr 是实数，但我们仍然可能要问， 
对所有1^0,哪些矩阵有 . r 7 Vlr >0( 即使/\不是对称矩阵 >. 如果 A 是 R 有复元素的矩阵.或 
若如果允许则可以用 

Re (, r " Ac ) > 0,其屮所 fj •非零丄 e tT 
来代替 （7. 1.1). 定义 A 的 Hermite 部分为 

hu) = ). 

时，这 m 好是复数 a 的实部. 

练习证明， （7.1. r ) 成立.当且仅当 h (.4) 是正定矩阵. 

练习证明，对任意 .4 eiW „. A = II ( A ) + S ( A ), 其中 s ( A ) = 1 U — 儿 ） 是 A 的斜 
[399! HtrmiUi 部分. 

习题 

1. 设 ACM , ,是半正定矩阵 Ri 6 C ". 证明， ■«_' Ar =0 的必耍充分条件进 / b >=0. 由此推 

III . 一个半正定矩阵 A 6 M ,, 有秩》，当且仅当它是正定矩阵. 提示： 考察二次多项式 〆 /) = 
(.3-+/ V )' I ty ), ? tR . 如果 0 ， 证明，对所冇 f , M 0)，0, [1 在 

时. ci / j / dz - O . 由此推出，对所冇 tvec "，>'*.4 x = 0, 因而 A . J . = 0. 

2. 证明，如果半正定矩阵在主对角线上有零元.则它所在的整行和整列必定是零. 

3. 证明，如果正定矩阵的主对角元都是+ 1，则矩阵的所有元的绝对值以]为界.可以等 
于1吗？ 

4 . 证明， t 正定矩阵冇秩1，当且仅当对某个非零向 M /, a 具有形式 

5 . 设是正定矩阵.证明，矩阵[^(^心^是正定矩阵，它的所有主对 
角元都是+1，且它的所有元的绝对值以1 为界. 这样的矩阵称 为相关矩阵. 提示： 求一个经 
某个实对角矩阵的相合. 


(7. 】. n 

(7. 1.7) 
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6. 如果 A 有实元索，证明，对所有非零 . 7 6 R "， 要求？ A . r >0 的条件只与 H ( A ) 有关. 

7. 证明，与 (7. 1.2), (7.1.3), (7. 1.4) 和 (7. 1. G ) 类似的各个论断对使得 H ( A ) 是正定矩 
阵的矩阵 AeM „( C ) 成立. 

8. 设/: R ， C 是一个函数，如果对所冇"=1，2,…和所有选定的诸点 ，心 ，…， 
J - JCR , 矩阵 [/( a — 是半正定矩阵，则称/是正定函数.证明，对所有， 6 R , 
./ C — Wi / Cr ). 利用 f - 正定矩阵的行列式非负这 一事实 证明，如果_/是正定函数.则 

( a ) ./(0)>0, H -1； 

(1>) /是有界函数， a 对所有 - reR , | fix ) I S ^/ CO ), n = 2； 

( f ) 如果 / 在 0 点迕续，则 / 处处连续. h -3. 

9. 如果/ 〆 』_), f 2 {^, •••, /,( x > 是正定 螭数 ， 《 lT «;,*■■，\是非负实数，证明函数 

0)__卜* + £；„/„(1>是正定函数. 

10. 证明，对两个给定的； 6R, 函数，是正定函数.试用习题9证明，对任意选定的诸 

点 f!， … I G t R 和任意非负数 ci ,. …，, /( t ) 十… +a/〆 是正定函数. 

11. 证明函数 cotiGO 是止定函数.提示： cos ( j ') = {^+ f' u )/2. 

12. sink ) 是正定凼数吗？ 


13. 如果是 R 上的非负可积函数，址:明病数 


fU) 


广 ■⑴ d / 


是正定函数. 提示： 利用定义. 

14. 证明函数 fU 〕一 1/(] !. r ) 是正定函数.提不：在习题13中，对；>0，设 gU ) = FS 

对 f <0， 设 g(t) =0. 

15, 由定理 <7. S . 3 )[_ 另见 7. n 节习题2」可知，如果 / U ) 和 W . r ) 都是正定函数，则 

亦是正定闲数.证明，如果 /(■!■) 是 in 定闲数，则和 | [{.!：) I 2 亦是 7 H 定函数， 
然后利用后一个结论由习题14推出函数 1/(1+/) 是正定 函数. 

115. 利用 （7. 0.2), (7.0. 2) 以及/⑴证明，对所有„ =1 , 2 ,…，矩阵 
(其中， u ： ,= l / CH - j - l ), ,, j = ], 2, ») 是正定矩阵. 

17. 证明，对所有2, …. 矩阵 /\ = [«, JeM ,,( 其中， a ： J = l / ii + j ), !, _?-1, 2, 
…， d 是正定矩阵.提示：对所有 


j, ( 土心 e > 0. 

汁 算这个枳分. 

1 S - 利用 （7. ]‘6) 证明，矩阵 A —[ a ,」] eM〆 其中 j }) 是正定矩阵.提示：对„ 
二4,这个矩阵是什么？考察相合 CAr , 其中 C 是实矩阵， 


C = 


e M„. 


國 





286 


第 7 幸 


llol ] C : 为什么是非奇异的？注意这个相合相当于从 A 所有其余的行(列)减去第一行(列) . 现在知道 
了在 CAC 的右下方(》— 1) XU —1) 子矩阵的形式.再用同样的方式对它实施一个适当的相 
合来化简这个矩阵.由此得出/ V 相合于 /. 

19. 利用习题18和极限证法证明，对任意 W >0, 核 K ( S , t ) = minis , 在「0, N ] 上是 
半正定的，也就是说，对于[0, Nj 上的所有连续复值函数 /(•), 有 

££ K ( j ,£)7( i )/(/) d . vd /^0. (7. 1.8) 

提示： 用等距点划分 N ], 然后把这个积分表/下成各个划分上的 Riemarm 和的极限. 

20. 证明恒等式 

minh - f }:/'。)/ ⑴ dsd ， = J " IJ " / C . s)djJ d ? 

对[0, N ] 上的所有复值连续函数 /(•) 成立，然后用它给出习题19中的论断的另一个证法.这 
个证法给出 K ( S ， r )= min { 1 -, /丨是正定的较强的结果；即 (7. 1.8) 中等式成立，当且仅当 /( r ) 
= 0. 提示： 把一.重积分表示成累次积分，然后用分部积分法. 

7.2 正定矩阵的特征 

正定矩阵有一些有用的和简单的特征. 

7.2.1 定理 H ermite 矩阵 AGM ,, 是半正定的，当且仅当它的所有特征值都是非负的.它是 
正定的，当 &仅当 它的所有特征值都是正的. 

证明：如果 A 的每个特征值都是正的，则对于任意非零有 

. 〆 Ar = s ' U ' DUs = y ' Dy = f ^ d . y . y , =■ ^ d , \ y , | 2 > 0， 

其中， I )= diag (^, d ,, A ) 是由 A 的特征值组成的对角矩阵 ， y = Ux , 且17是酉矩阵. 

其逆命题包含在论断 (7. 1.4), 向半正定的情形是类似的. □ 

_ 练习证明，非奇异矩阵是正定的当且仅当 A — 1 是正定的. 

练习设力6时„是半正定 矩阵. 试用 C 7.2.1) 证明， A 是正定的，当且仅当 ran kA = «. 
试与 （7. 1) 节习题1比较. 

7.2.2 推论如果 AfM , 是半正定矩阵，则对所有{ = 1 , 2 ,…，也是半正定矩阵. 

证明：如果 A 的特征值是 Al ，…，则尔的特征值是 A ;, …，； I :. □ 

7.2.3 推论如果力=[\]6轧是仏 111 ^矩阵， R 是严格对角占优的，又如果对所有；=1， 
2，…，《有、>0,则 A 是正定矩阵. 

证明： 这是定理 (6. 1.10) 的一部分.诸条件指出 A 的每个 GerSgorin 圆盘位于开右半平面 
中.因 HeTmite 矩阵的特征值都是实数，所以 A 的诸特征值必须都是正的，因此由定理 
(7.2. 1) 可知 A 是正定矩阵. n 

练习如果 Hennite 矩阵 A ’ 相合于具有正对角元的严格对角占优矩阵，证明 A 是正定 
矩阵. 
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T 面的特征对于通过计算来确定正定性没有多大的实用价值，但是在理论上它可能很 


有用. 

7. 2. 4推论设 A 是 Hermite 矩阵，乂设 

-I … U„ 

是 a 的特征多项式.假定且〜.„尹0.则/\是半正定矩阵，当 a 仅当^乒0对所有 
« 成立且卜|<0对 A = m , …， w — 1成立.我们规定 = 

证明：论断只是要求，前面的诸系数山是非零的， [ i 它们的符号是严格交错的.如果这 
个条件被满足， fA ( t ) 就不可能有任何负的 零点； 西此 A 的所有特征值必须是非负的.反过 
来，如果 A 是半正定矩阵，它的正特征值记作 A ,， A 3 , …， A „( 其余 《 — m 个特征值都是零）. 
用 B 纳法可以证明，各个多项式 (/- Ai )( r - A : ), (/ — 1)(广.1 2 )..‘（?一 A „,) 的诸 

系数都是非零的，丑它们的符号是交错的.乘以 r ™ 便得 Add . □ 

为了使下面的特征更容易被接受，用八表示由 A 前；行和前 ; _列确定的 A 的前主子矩阵， 
A t = A ({ l , 2, i \), i -2, «. 我们已经知道，如果 A 是正定矩阵，则 A 的所有主子 

式都是正数，事实上，当 A 是 Hermite 矩阵时，逆命题成立.但是可以得出一个更强的结论. 
需要指出的是，如果 A 是 Hennite 矩阵，则毎个 A 也是 Hermite 矩阵，因此毎个 A , 有实行 
列式. ， 

7.2.5 定理如果 A 6 K 是 Hermhe 矩阵，则 -4 是正定矩阵，当且仅当 det 九>0对! = 1 ， 
2,…，〃成立.更一般地， A 的 n 个主子式 （ 不一定是诸前主 子式） 所组成的任—套序列的正 
性是4为正定矩阵的必要充分条件. 

证明：由 （7.1.5) 可知，只要4是 iK 定矩阵 ， det A ,>0 就对所有；=1 ， 2, …， 都成立. 
我们用归纳法和 Hermite 矩阵的交错不等式组 （4. 3. 8) 来证明其逆命题，因为 cletAX )， 且 
A 是 1 X 1 阶的， 所以或 是正定矩阵.如果对某个务 A * 是正定 矩阵， 则次 的所有特征 
值都是正数，因而由交错不等式组可知，或许除了的最小特征值以外， 人 +1 的所有特征 
值都是 正的. 但是糸 +1 的各特征值之积正好是 det 人.^根据假定，它是正数， 因此皋 +1 不 
可能有负特征值.由此 可知. Au 的最小特征值也是正数，因而 Au ., 必须是正定矩阵 .凶为 
怠 =/ U 所以 A 是正定矩阵.对于•一般套序列情形， R 要考虑 A 的各行和各列的适当置换就 
可以了. □ 

定理 (7. 2. 5) 说明，当（且仅当） Herniite 的各前主于式是正数的时候，它就是正定矩阵. 
再想到 (7. 2.1)，于是为 r 验证正定性，可以检验与 A 相关的这两组数中的任何一组. 

练习试用 （7. 2. 5) 证明矩阵 



是正定的. 

练习 证明对称矩阵=的各前主子 式是作 负的，但它不是半正定的. 


_ 
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练习 设 A 6 R 是 Hemiite 矩阵，乂假定如 t 4,>0, dc ( A ,>0, det ; >0, il 
del A „>0. 证明 A 是半正定矩阵. 提示： 如果将 A „ 的诸特征值与 々，^的 诸特征值比较，交 
_ 错不等式指的是什么 '? 

练习 假定 Hmniu ‘矩阵 A6M,, 有全部止对角元和正行列式，考察矩阵 


LI 1 ll 

对适当的 f 值 kE 明，仅冇上述假定还不能确定 A 的正定性.证明，若另有某个 ( r ; ]) X (»-1) 
主子矩阵是对角 A 优的，则这个假定条件是充分的. 

练习设 A ( EM „ 是 Hermhc 矩阵，证明， A 是半正定矩阵，当且仅当存在一系列 
Hermhe 矩阵 A r ， 使得当^0吋 A ,— A , 且 A t 的每个主子矩阵有止行列式.由此得出，如果 
A 的所有主子忒都是非 负的， 则 A 是半正定矩阵. 

对所冇々=1，2,…，每个正实数有唯一的正的 A 次方根.类似的结果对正定矩阵也 
成立. 

7.2.6 定理设 A 6 R 是半正定矩阵，且是给定的整数，则存在唯一的半正定 Hermit 
矩阵 B 侦得把 = A . 冏时还有 
U) R4-AU ； 

( b ) rank ^ = rank A , 因啪，只要力是正定矩阵， B 就是正定矩阵； 

( f ) 如果 A 是实矩阵，则 Bill 是实矩阵. 

证明： 我们知道 Hermite ■矩阵 A 可酉对角化成 八 =!^1[.7 、 其巾 A-diagG, ，…， AJ 且 
所有定义 B = [7 W 、 其屮 jUEEiciiaKUr ， A ： 1 ), ti 每个 A , 都取唯-的 A 次非 
负根.显然， =A 且 B 是半正定 Hernme 矩阵.此外_ AB = UAW UA '^ U ' = UAA ]：t W = 
UA 1 k AV = UA ' ^rUAV = BA , 乂因为所有 A , ( 因咁它们的々次 方根） 都是非负的，所以 B 
是半正定矩阵. B 的秩正好是非零 A , 项的个数，它也是 A 的秩.如果 A 是半正定实矩阵，则 
我们知道 U 可以选为实正交矩阵， W 而在这种情形 S 显然可以选为实矩阵.余下要考虑的只 
是唯一性间题. 

tt 先要指出的是，存在多项式〆 f )， 使得为了得到 />( A)=A l 〃， 从而得到 
p ( A )= p(UAW )" = UA li U " 我们只需选取 Mf) 为适合数组 U” A 1 .*), …， 

U„，A, 1 /) 的 Ugrange 插值多项式 （0. 9. 11). 另…方面，如果 C 是使得 C* = A 的任一半正定 
SM] Hermite 矩阵，则有8 = /，(4)=〆^*)，因而（: B = Cp (f :*)— 因为 B 和 C 是可 
交换的矩阵，它们可以 R) 时酉对角化；即存在某个两矩阵V■和具有非负对角元的对 
角矩阵 A, 和 A” 使得 iMV/iiV .和〔:二于是从汗 =A = C 的事实可以推出七 =¥. 
乂因为非负数的非负 々次方 根是唯的， 因而 得出，因 |hiB = r . 

□ 

上述定理最有用的情形是 A = 2 的情形.正定（半正定）矩阵 A 的唯一正定（半正定）平方根 
通常 k ! 作-4 12 .类似地，对每个々=1，2，…，焱 1 * 表示 A 的唯一正定(半止定从次方根. 
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练习确 cr 
练习如果 a 是正定矩阵，证明 

7.2.7 定理矩阵乃 eM „ 是正定矩阵，当 M 仅当#在非奇痒矩阵 CGAi , 使得 J 3- CC . 

证明：如果 fi 可以这样表则根据（ 7 . 1.6), B 是正定矩阵.为丫证明可以得到所要求 
的分解，只要设〔;= 尺 \甚至还可以取 r 为 Hemme 矩阵. H 

7.2.8 推论 Hcrmito 矩阵 A 是止定 矩阵，当且仅当它‘相合 f 单位矩阵. 

证明： 这只是重述 （7. 2. 7). □ 

练习如果 -46 M , 是正定矩阵.乂如果 .4 = ^ ti -4 = 6 VC ; , 其巾 Q , 6 M „. 证明 
C ',= VC , ,其屮 V 是西矩阵.特别地.证明 A = (; 的任何解 C 具有形式 t : = VA ^, 其屮 V 
是酉矩阵.提示：证明 

. A " 12 C " CA 1 - = ( CA - 1 - ( CI 4 

能够明确指出半正定矩阵 A 的分解 A = c _ r , 这有时是很有用的.每个方阵 C 有 Q 7? 分解 
(2.6.1)， ll _ C 呵写成 r = 其屮， Q 是酉矩阵.而尺是与 A 有相 R 秩的上三角矩阵.另一 
方面 ， A = C C -( QR ) QR ^ R - Q ' QR = R ' K . 如采 C ： 非奇异，则可以选择 i ? 使得它的所有 
对角元都是正数 el : 际上，存在这种形式的唯一分解 c 〕= Q / e )， 乂如果 c : 为: i : 矩阵，则 q 和 fi _ 
均可取为实矩阵.这就证明丫下述推论.它给出 r A 的 Chomsky 分解. 

7. 2, 9 推论矩阵 A 是正定的，当 U 仅当存在 具有正 对角元的非奇异下角矩阵使得 
A = LL -. 如果 A fi 实矩阵，则 L 可以取为实矩阵. 

设％ ，…， w 是内积空 M V 屮4个给定的向暈组成的集合，乂设<， .*> 是7上给定的 
内积-肉撻组巧，…，叫 关于内 积 （■ ， . >的 Gram 矩阵是用 心二 （ , v , ；■定义的矩阵 G — 
U ,,」 eM 4 . 半 iF _ 定矩阵的最后-个特征是，它们总是 Gram 矩阵 （7.2. U ). 

7 .2. 10定理设是向景组 i 助，…， ^ t }(= r 关于给定的内枳 （■ , . >的 Oam 矩阵， 

乂设 [ ID ] W ;; … UJ *] t . 则 

( a ) G ' 是半 tK 定 矩阵； 

( b ) C ； 是非奇异矩阵，当且仅当向量组 if 』， …，是无关的； 

U ) 存在正定矩阵 Ae At , 使得 

( d ) rank G = rank 向量组，…. w ' J 中极大无关组的向量个数. 

证朗： 如果6=[。]， w ,), 于是因为内积有 Hemite 性质，所以 G 是 
Hermit 。 矩阵， R . 

k ^ k 

丄二 2 开 "，.」、 - XI 

W-l 1^=1 r f ,rr j 

- 〈公 v“v 荃 ， r - 

其中 il _ l 是由已 给内积诱导的 范数. 根据范数的七定性，只有当 
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= 0 

I - J 

时等式才成立， rfiiH . 只有当给定的向量组相关时， h 式才对非平凡系数组 a 成立.如果 G 是 
奇异矩阵，则存在某个非零向 til 使得<^_ = 0,因如/6^ = 0,这推出向量组叫是相关的. 
反过来，如果 f ++++々 奶=0, R = 则我们已经证明， 二 0,因而 G —定 

_ 是奇异矩阵. 

如果…，是 C ■的标准正交基，则根据 U ) 和 （ h ), A = 是正定矩阵.对 

任意向量 a ， „ v 6 C " 有 

(，，，> =〈 〉= 2 = x ' Ay , 

' 3=--) p 'I f … _1 

于是有 h = u \) = w ： Aw ,, 因而 G = 

最;5，如果&=0, 则 ， Gy — = Ad .)=0, 因为 A 是 IF 定矩阵，这 

就蕴涵反之， Wj' — 0蕴涵 G』_ 二圯 WW. r ) — 0,于是 A 与 W 有相同的零空间，因而 
有相同的秩.圯的列秩是向量组(也,，…， aW 中极大无关组的向量个数. □ 

练习定理最常见的应用是针对所给内积为普通 Eudkt 内积 <.r ， 的情形的.证 
明，在这种情形， A = U 并且证明给定的向 tt 组彳吧，…， xtUCC" 中极大无关组的向董个数 
恰好是矩阵 ~=[.uc w .jeH 的秩， 

7.2.11 推论设 AeJW „ 是给定的矩阵.则 A 是秩为的半正定矩阵，当 K 仅当存在恰好 
含有 r 个无关向 it 的向量组 S ={ Wl ，…， u ^ tzc "， 使得 A 是 S 关于 Euddi 内积的 Gram 
矩阵. 

证明： 充分性部分在上述定理中已有论述.至丁-必要性，可以利用 （7. 2.6) 把 A 写成 A = 
B 是半正定矩阵./3的秩与 A 的秩相同， U . A 二皮 =/T B 是 ii 的各列在 Euclid 内积下的 
Gram 矩阵. □ 

习题 

1. 证明，如果 A 是 Hermitc 矩阵，则对所有是=1，2,…，是半正定矩阵， W 〆 是正 
定 矩阵. 参看 ( 5 . S . 15) 下面的练习. 

2. 如果 A 是半 TH 定矩阵，又如果 〆 f ) 是使 p ( f )>0 时对 所有？ >0都成立的任一多项式， 
证明 WA ) 是半正定矩阵. 提示: 的诸特征值是 什么？ 这是如何推广 了七题 1? 

3. 试用 （7. 2. 5) 证明，用 J } 定义的矩阵 A = [\ ] 是正定矩阵.提 示：计 

_算 detA ; 从所有其余行中减去第1行，然后对第〗列也这样做， aiJ = m a x {/, 说明什么？ 

4. 如果 A 和 S 是正定矩阵，证明直和也是正定矩阵. 

5. 给出一个（非 Herniite ) 实方阵的例子，它的各前主子式都是正数，但使某个特征值有负 
实部. 

S . 试给出 （7. 2. 5) 中一般不等式组的洋细证明.即证明，》个主子式（不一定是诸前主子 
式，按包含关系 >所构成的任一套序列的正性是 《 X fl Hermite 矩阵为正定矩阵的充分条件. 
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7. 如果用 A 的诸子式的符9来表示， A 是负定（半负定）的必要充分条件是什么？ 

fi . 半正定矩阵 A 有不冋于的“平方根”吗？有多少？有不同于 A 1 " 的 々次方 根吗？有 


非 Hermite 平方根吗？ 提示： 考察 


9. 如果 B 6 M „ 是半正定矩阵，丨|_冇秩证明，存在秩为 ™ 的爪乂 ?1 矩阵 C , 使得 B = 
<y c. 特别要指出的是，秩为 1 的半正定矩阵总可以写成形式 I /， 其中为某个向量. 

10. 假定是半正定矩阵， | j . 冇秩 rd 证明 A 有 rXr 阶正定主 f 矩阵. 

11. 设 ACM ,, 是 Hermite 矩阵，证明， A 是正定矩阵，当且仅当经典伴随 adj A 是正定矩 
阵 n _ detA >0. 如巣 A 是半正定矩阵，证明 ， adj A 是半正定矩阵且 d et A >0. 搵示： 考察 
A r = iA - h £ r , e >0. 试考察 A = diag (0. 0, —1) 来说明，如果 A 不是中-正定矩阵，也可能 adj 
A 是半正定矩阵且 d C t 

12. 已知 r &(0.1), 考虑由定义的实对称 Twplitz 矩阵/\ 试如下 

证明 A 是正定 矩阵： U ) 如果 A , 是 A 的 z _, j _ 子式，证明，只要 | j | >2就有 (kt A ,,.=0. 
提示： 如果； =1丘_;_>2,则可以看出 A ,, 的第1列是第2列的倍数. （ bH ^ D „ = cietA . iiE _ 

- r % 然后将 D flll 按第1行的余 - f 式展开.且利用 ( a ) 址明 D „ t ,= D „— r 2 认 = (1 — r 2 ) a , 
= <1 — 〆 ）". （ c ) 利用 （7. 2. 5) 推出 A 是止定矩阵. 

13. 讪明习题12中的矩阵 A 冇一个宄对称-对角矩阵为其逆，冉证明， a~/)A 1 在上 

对角线和下对角线的每个位置上有元素_ 6 R 它冇主对角元〗， 1 + r 2 , l + r : , 1. 提示： 

利用习题 〖2( a ) 证明 A 1 是二 对角矩阵.为什么 A ^•定是对称矩阵？然后利用 AA ! =A 
=/确定 A 1 的各元素. 

U - 设〈■，_〉是(^ t . 给定的内积，设…，^^是口(关于普通的 Euclid 内积）的标 
准正交基，乂设 G 6 A 1 表示 M 关于所给内积< _ , *>的 Gram 矩阵.证明，刈所有/， ySC " 有 
( j -,3^ = y ' (;- r . (7. 2. 12) 

由此可得，函数 <•, ，〉： CXC — C 是内积，当且仅当存在 FH 定矩阵 G 使得 (7.2. ]2)成立. 

I 5 .回忆一下 fr :( 5 . 4 . 1 2 >中定义的对偶范教概念.设< * , • >是(："上给定的内积，且设 
HI 是 C " 上给定的范数.所给范数不一定是由所给内积诱导的.我们可以定义 HI 关子内积 
〈‘，，〉的对偶范数为 

II r max I <j , y) I. 

f jil -i " 

注意，如果卜，是普通的 Euclid 内积，则它就是|卜 II 的普通的对偁范数.对偶范数概念 
的这种推广可以产生用其他方法尚未得到过的向暈范数吗？ 提示： 利用习题 U ， 记 U ，, v > = 
yG _ r ， 然后证明 

II .r|ir...，= im ( li _r II I 

1 G . 设 AtM , 是给定的矩阵，证明， P ( A )< 1 , 当且仅当存在正定矩阵 S 6 M 。 使得 B — 
是疋定矩阵. 提示： 如果 B 是正定矩阵，设如果 
B ~ A ' BA = (：' C - (CA )， ( CA ) 

是正定矩阵，则对任何非零 . rec " 有 


_ 
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x* [(：* C— (CA). (C4)> > 0， 

或 || Cr || } > || C 7 U ' || 2 .设 y = C ^. 证明对所有非零 ） 七 C " 有|| ；y || 2 > || CAC j || ; ,由此得出 
I C；,AC ' j |,< l . 因此 〆 A ) 二 〆 CAC ' X'CAC 1 ,<1. 反过来， 如果 〆 A )<1， 则存 tt 非奇 
异矩阵 re 使得 .i CAC -'!|'< ua (5. 6) 节习题 2 5]. 并丨 Li ： 述证明可以反推回去，冉令 B 三 
C' C. 

IV . 设 A ， BeJW „ 是半： iK 定矩阵，且不都是奇异矩阵.证明 £3\< l | y [ A ™< A ) 

t 提示：设尺=儿_ B . 设工 & C " 是使心一 At 且 i A I - pCF )='| F | 的单位向量. 

于是， A --^ = ALM EA-E 2 , 并且 l || A : — 庄 ：| 2 > | ， （/\E 十 EA — 好） j |，| A | ( x 1 A.r +- 
圆 j ' I A ! ( A lllI „( A )+ A „ ll „( B )). 

IS. 设 A, 半正定矩阵， K 假定力是 1F_ 定矩阵.利用习题1?证明 

|| A 1 ; 2 ^ i A 1 ^ !|, | A B|, (7.2.13) 

ffil . 说明为什么这个不等式蕴涵以下事实：定义 / t ■:由 M „ 中的半正定矩阵所组成的集合上的函 
数/: c :—(: 〃在这 个集合的内部(它是由正定矩阵组成的开集）连续.亏出并直接证明关于[0, 
ml 上的普通纯量的平方根幽数/: 士的不等式，这个不等式是从 （7.2. U ) 中令 fl = l 得 
来的. 

7.3 极形式和奇异值分解 

下面，论述（不 定是方 阵的）复矩阵的两种相关的重要分解，它们与正定性概念 有密切 
关系. 

7.3.1 引理设 jL rank 则存在酉 f 矩阵具有非负对角元 

…一 A „, = 0 的对角矩阵 AtMj , 以及具有标准正交行的 yeM ,„,„, 使得 
矩阵 A = di 叫 U ，…， A , J 总是唯一确定的，且 U ?. …. A ;,) 是 A 4' 的诸特征值. 
矩阵 X 的各列是 A 4 ‘的特征向置.如果 AA •有互不相 同的特 征值，那么. X 可确定到相差一 
个右对角因子 D = di a g (一1,…， 〆 .），其中所有也就是说，如果则 
x 2 - x , d . 给定) an ， 如果 ran kA = m ， 则矩阵 y 是唯一确定的.如果 a 是实矩阵，则入-和 
V ■可以取实矩阵. 

证明： 如柴 a = xav ■是 所要求的分解形式，则 aa " ax ‘= xawx * , 

因而 XAU Hermhe 矩阵 AA " 的酉对角化.若； f = Uw J 且/ = rfiagU ? ，…， Afj ， 
则2，…， w , ft 向量组是标准正夂组.因为 /! 的诸对角元是非负 
的，且按递减顺序排列，所以71由 AA * 唯一确定.如果数组 U ?} 是互不相同的，那么，除了 
相差一个模为1的复纯量因 f 以外，的咨个相应的 TK 规化特征向暈都是确定的， 因此 ，如 
果 X ,和&是其各列为 AA •的特征向董的两个两矩阵，则一 定有& = X , D , 其中 ， diag 
(d' 、…， d ,‘） 、且所有 i J , I =1. 

AA+ 的相应于重特征值的特征向量不是唯一确定的，但是，它们一经选定，且把它们标准 
正交化，两矩阵X就固定下来，如果 A 是非奇异矩阵，也就是当 6 = r ank A = ™ 的时候，则 Y 
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=h A 是唯一确定的.我们不难验证， iT ' =A l X - ( AA - X)A 1 ' X * XA 2 y 1 * = 

A ' A 2 A- l = I , 因此，这个矩阵 I " 有标准正交行. 

余下只要讨论 rank A = A<m 的 情形. 因为当所有; I ,考0时，我们希望有 Y = A ' X ' A = 
,这促使我们定义 Y 的第行是行向量.>_/ . 其中 j -1, k . 

于是 

[ A ； 1 CA " x ,)] ' LA *' ( A ' j- t )J = . r ； AA ' j ' t / Aj-At = 丄/丄 = 丄/山 / A , 

如果它就是零，如果 _；= K 它就是1，这是因为向景组 {.rj 是标准正交组.向 M 组 <.V, ， 
…，％：■是 C" 中的标准正交组.且 W 此兄外有 M —々个（但不是唯一确定的） 标准正 
交向量 3* 卜丨，…， .V,„, 使得矩阵 Y+ eLvkV : … njGAC,」 有 m 个标准正交列. 

现在证明 X‘A — jy. 根据向量 >，，的定义，这个恒等式两边的前 A 行是相等的.因为/I 
的最后个对角元是零，所以心边最后 A 行都 是零； 左边最后 m 々行也 都是零，这 
是因为，如果 =0 ， 则 0 = ^-； AAV, = (A 沁 >' ()=0， 因而 A >, = 0. 

最只，如果 A 是实矩阵，则九4•也是实矩阵且冇实特征值，因而，特征向童组 A 可以取 
为实向量组.根据定义，由 x 确定的 y 的前 A 个行都是实的，添加的 m — +个止交单位向最可 
以取实的.因此，如果 A 是实矩阵.它的所有因子都可以取实矩阵. 口 

每个非零复数_/胃有唯一的“极表示”《 = 其中 f 是正实数， 向“ 是模为1的复数.实际 

上，如果 ar 参0, 则户 = u | 且 u-^p ^ z=zi U I . 如果 z = 0, 则 Z 仍然可以写成 P = 0 的极 
形式，不过《不再是唯一确 定的. 当然， u 可以取模为1的任意复数. 

如何把这种极表¥推广到复矩阵 A 6 A 1,, 呢？.种回答是 AwPLT , 其中， P 是正定（半 JH 
定)矩阵，而 [/ 是两矩阵.甚至还可以把它推广到 A 不是方阵的情形. 

7. 3. 2 定理设 A 6 AC „ ， J 1 ■则可以写成 
A = PU . 

其中，半正定矩阵 ， rank P = rank A ,而标准正交行（即 [ JU ' = J). 矩阵 
f 总可以唯一确定为 P = (AV 广\而当 A 有秩 m 时，[/是唯一确定的.如果 A 是实矩阵， 
则 P 和 [/ 可以取实矩阵. 

证明： 利用 （7. 3.1) 把 .4 写成 A = XY, 且令 P=XAX * 和于是 P 

是半 IH 定矩阵，且 C/Lf 1 =XYY*；T =X/X' =X；T =/，因 Idi L； 有标准正交行.根据 （7.3.1) 
中的构造法， P-(AA* ) 1： , 一般说朿.如果 A = PC/, 则 AA* =PULT P = P 2 , 所以 i J 一定 
总是 AA' 的（唯一）半正定方根.如果 A 有秩 m , 则 P 非奇异，而且[/二尸- 1 ，是唯一确定的. 
(M 是，正如在 （7. 3. I)中看到的，如果] rank 则 Y 的相应于尸的0特征值的各行不是唯 

一确定的，因此，当 rankACm 时. l/= 未必是唯一确定的. 口 

本定理直接推出下述重要的特殊情形. 


7.3.3 推论如果 A 6 K ， 则它可以写成形式 

A = PU . 

其中， P 是半正定矩阵， （7 是酉矩阵.矩阵 P 总可以唯一确定为 P = ( AA * V ' 如果 A 是非 
竒异矩阵，则 [/ 可以唯一确定为 [ A . 如果 A 是实矩阵，则 P 和 U 可以取实矩阵. 
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练习说明定理 （7.3.2) 可以用下述极限证法来证明.如果 A 是非奇异矩阵，则令 
( A . A -)'=. 定义 I / fP 且验证[几厂 =_ f . 因此， 尸和 L ； 都是唯一确定的.如果 A 是奇异 
矩阵.考虑以及形式 A f = P s [/ s , 其中两个因子都是唯一确定的.利用选择原理 
( 2 . 1.8>得到序列 0 ( 当 时）， 使得当 = 时， L ；% 按对应元收敛于酉矩阵 U . 因为 
-我们还有尸 St — P 和 A = _ PU . 值得指出的是，从理论上讲，这个证明虽然比前面 
对 （7. 3. 2) 所做的证明更简略，但是当 A 是奇异矩阵时，它并没有给出得到因子 P 和 L ； 的构造 
性方法. 

分解 （ 7 . 3 . 2 ) 称为矩阵 A 的极形式或极分解.当 A 满秩时，两个因子还是唯一的. 

练习如果 A6JVL ,, 且证明它可以写成 
A - IPQ, 

其中，评£粘„,,„有标准正交列 （ 即^识二/),而 QeM , 是半正定矩阵.提示：利用 C7 . 3 . 2 ) 分 
解 A ' 

练习设 ^ rec " 是给定的非零向量， H . 证明 A 的极分解是 A =. c = |U | U , 

_其屮 u = jc ! || t || 2 . 故极分解可以看作作零向量的简便分解 y 2 ( j -/ || 到矩阵的 
推广. 

练习证明，力阵 A 既可写成 A = P [ J , 也可写成 A — WQ , 其中， P =( AA - ) 1 ! ,而 0 = 
( A7\) l : . 有时称它们为/\的“左”和“右”极分解.证明，唯一确定的半正定因子 P 和 C ? 相等， 
当且仅当 A 是正规矩阵.实际上，如果 A 是非奇异矩阵，则唯一确定的酉因子 [/和 W 恒相等 
「定理 （ 7 . 3 . 6 ) 前的练习]. 

练习不是每个方阵都是正 规的； 即 AA + 未必成立.但是 AA * 总酉相似于 AM . 试 
用极分解 （ 7 . 3 . 3 ) 证明这一事实. 

7 . 3 , 4 定理设/乂设 A — H7 是极 分解. 则 A 是 IK 规矩阵，当且仅当尸 17 = 1 /戶. 

证明： 如果 P 和 U ■可交换，则 AA * = PL/LT P -= PP 二卢， A'A = W P * PU = U a P^U = 
[ J *( JF 2 = P : , 因而 A 是正规矩阵.如果 A 是正规矩阵，则户产 ( 7 . 我们知道， F 2 和 
r 广严 1 /都是半正定方阵，且显然冇相应的半正定平方根 p 和 tr pu 但是定理 （ 7 . 2 . 6 ) 说明， 
这样的平方根是唯一的，因而 p = u * 或 [/ f = pu . □ 

我们的下一个 g 标是，从（ 7 .丄 i > 得出（不一定是方阵的)任意矩阵的奇异值分解. 

7 - 3 - 5 定理 如果力 冇秩 i ：， 则它可以写成形式 

A = ^2^* , 

其中 VtM ,„ 和是酉 矩阵. 矩阵 2 = ，对所有,有〜=0,且如身勿彡… 

> 咖 …0,其中 „}• 数 ( crj 三是 AA * 的特征值的非负平方 
根，因而被唯一确定. F 的各列是的特怔向量，犯的各列是,4 Vi 的特征向量(它们的排列 
顺序与相应的特征值 < 的排列顺序相 同）. 如果且 AA * 有互不相同的特征值，则 V 可 
以确定到相差一个右对角因+ D 二 diagkA ， .“， < A ), 其中所有也就是，如果 A = 
V.SWr = V ；， SW .； , 则 V : = \/ iD . 如果 ™< n , 则识一 定不是唯一确 定的： 如果 7i = m ， 且 V 
_已经给定，那么圯是唯一确定的.如果则 V 和识的唯一性要裉据力’来确定.如果_4 
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是实矩阵.则 V . 2和 W 都可以取实矩阵. 

证明： 不失一般性，假定否则用 A •代替 A ). 利用 （7. 3,1) 可把 A 写成 A = XAY , 

其中， X , A 6 M „, 且 令 取丨 0]£ M _, 11 定义见三 [ Y ， | S * ]6 

使得 W 的各列是 CT 中的标准正交组. Y _ 的各列已是标准正交组，所以，如果》,<„， B [选取 
S + eJW „.,,_ ml 的各歹 iKOl 不唯一 >使 W 为酉矩阵.这直接推出 V 2 W = XAY =/\. 关于唯一性的 
论断可以从 (7.3. D 屮的相应论断得出. □ 

对 i = l , …， ?= rain { m , n }, 2的“对角元” < r , =〜称为 A G 的 奇异值 （有时只对非零 
对角元才这样称呼 K 而 V 的列和 VV 的列是 A 的（相应左和右） 奇异向量. 分解 （7. 5) 称为 A 
的 奇异值分解. 极矩阵 P 是儿 V 的唯一半正定平方根.而奇异值 a 是 AA ' 的特征值的非负平 
方根，所以 A 的奇异值与极矩阵 P 的特征值相同.虽然奇异值按递减顺序排列是方便的，但 
这并不是奇异值分解中的一般 规定； 它只是由 A 唯一确定的一组竒异值. 

应该指出，奇异值分解是正规矩阵的酉对角化到任意矩阵的自然推广.由于这个理由，常 
常有这种情形，关于正规矩阵的特征值的一些结果可以推广成关于一般矩阵的奇异值的一些 
结论. 

练习设 rer 是给定的非零向量， M . 证明， A 的奇异值分解是 A = i = 

V 2 W ,其中 ， W = [ l ] eM , , 2 = \_ || j - 1| 2 , 0, 0] r eM ,„, ,而 ，…， ％]6 M , 有 

巧 =' r / IUII ?， 且巧，…，％是与 . r 正交的任意 „一1 个单位正交向置. 

如果 AtM„, 则奇异值分解中的三个因子V，2和 W 都是 nX n 矩阵.如果 A = PLf 是 A 
的极分解，又如果是 P 的酉对角化，其中 P 的（一定非负）诸特征值按递减顺序排 
列，则 A = _P[/=VylV‘l/ = (VO(A)(V-LO— 仙妒，是 A 的奇异值分解，其中 V = E - A , 

且识注意到 A 4, = V 2 W * W 2 V ’ 因而 V 的诸列是 Hemite 矩阵/ W •的相 
应于特征值…， d 的特征向 M . 另外， A'A = WSV V 2 W ,因而 W 的诸列是 gjs ] 

A ' A 的特征向量. " 

练习如果是非奇异矩阵，证明下述步骤给出竒异值分解 A = V 2 W * : 

( s ) 作出正定 Hermiie 矩阵 AA * ，然后通过求‘的各(正）特征值 U ,) 以及相府的正规化 
特征向量组《,算出酉对角化 A/T ^UAW . 
a ) 令和 V = t /=[ Mr .‘ a „]. 

( c ) 令 W = A ^ V 2 

证明 W 是酉矩阵 11 A = V 2 W . 提示： 计算 W ' W . 

练习设是给定的（不一定非奇异 ] 矩阵，证明下述步骤给出奇异值分解 a 
- V 2 W * : 

U ) 存在某个 t = dA )>0, 使得对所有正 e< t , A ,= A + d 是非奇异矩阵.设 0< e <“ 

(10 利用上一个练习中的方法作奇异值分解 A f =^ XW ；. 

( c ) 利用选择原理 (2. 1.8) 且设 e -0, 通过值的序列使得 
lim V ； = V 和 lim ^ W 

4 _ 0 t, ^ ' 


都存在. 




(d) 证明 /1-V2W . 其中 

c * > 

这个可以用来 iiP 月•般的奇异值分解 （7. 3. 5) 的证法保证存在一个奇异值分解，但是，当 
A 不是满秩的时候，它一般没有给出计算奇异值分解屮的各个 W 子的构造性方法. 

练习假定 A6M,, 是非奇异矩阵， fl.A = P[；, A--WQ 是 A 的左和右极分解，其巾尸， 
Q6M,, 是正定矩阵， U. W6M,, 是酉矩阵.证明恒有0 =见，但是， P = Q 当且仅当 A 是正 
规矩阵.如果 A 是竒异矩阵，址明存作4的左和右的极分解使 提示： 如果 A = 
是 A 的办异值分解，则V或 W 都不是唯一确定的，但是， .4 = ( 胃 • KW2W' )= 
(V^y )(FW- ) ； 采用 （7.3. :i) 的唯一性部分.考察 .4 = 0, 说明，如果 A 是奇异矩阵，刚 A 
的两个极分解中的酉 W f 不一定相同. 

如果 A & M 是正规矩阵.且 A - V 2 W 1 是奇异值分解，则 AA ^ A ' A ， 因而 AA * 和 A*A 
有柑间的特征向量.似是，由此不能推川，在 A 的奇异值分解中有 V = W ， 因为"=讲时， 
就一定是（共至是半正定 ） II crm i te 矩阵.如果 A = LiU 厂足71的两对角化，且 4 — 
di 叩认，…，夂），则每个 A ,= U I ，对某个呔 eR 成立； 如果； U =0, 选 ft =0. 如果令 ZJsdag 
A ) 和 I /i I = diag ( ! A , I ■ I A „ ! )，则/卜 I /-). I - IA -[.7 A [；' =U \ A | DU '= 
(⑴ （| A | )( ㈤ 是 A 的奇异值分解.其中， V ^ U , 2= I A I ,且 W = L ! D . 

_ 此，正规矩阵的奇异值正好是其特征值的绝对值， V 的各列是 A 的恃征向量， W 的各 
列视为与 V 的各列相同，只是每一列都乘以一个由相应的特征值确定的绝对值为1的复纯量. 
如果 A 是 Hermite 矩阵，则所有特征值都是实的 ， D = Fj II. D = diag(sgn(Xi ) !… ， sgn(A„ )). 
其中令 sgn(0) = ], 如果 A 是正定 Hermke 矩阵， _D=J, V = W = U, a A=2. 

S^lujr 〒角化定理 （£.3. 1) 的 -* 个有效应用是.证明广每个复方阵是具有互择特征值的矩 
阵的极限.奇异值分解可以用来证明每个复矩阵（方阵或非 方阵) 是具有互异奇异值的矩阵的极 
限.这可能是有用的，因为在奇异值互不相同的情形，奇异值分解具有不完仝的唯一性. 

7. 3 . 6 推论如果给定的矩阵，乂 ||*|是 M 上的给定的范数，则对毎个 E >0, 
存在具有互异奇择值的使得 O . 

i 明： 假定设 ft A 的奇异值分解，乂设 

% s = LJiag ( cr [ + 5. CT ； mS ) ! 0] 

其屮 0£ M „, 如果 _4 的所有奇异值都相等，则对所有5>0, &将有互不相同的对角元. 
4、然的话.如果选取 d ':>0 使得 m 3 小； f 各个不同旮异值间的最小的差， 则厶 就有互不相同的 
对角元.在这两种情形.气&-0时.為 —2. 如果令 A 三 V & W " ，因为 Frobenius 范数是西 
不变的，所以当心 — 0 时 . || A - A s ||： ; = || t — L -0. 何是，耐_上的所有范数都是等价 
的，因此完成 r 证明.如果^>〜证明是类似的. □ 

有一个简.申.的变换使我们能把 Hcrmxe 矩 阵的又 于特征值的结果转变成任意矩阵的关十奇 
异值的结果. 

7, 3. 7定理设 q = mui \ m , n ) , 并且定义 A t ，「为 
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%是非负实数.则 A 的奇 异值是 a , ,仍，…，％,当且仅当的 m +« 个特征 
值是 tii , a 1 *" . a „ , - i 7 i , —巧.…. 一 (^ 和丨 m —n I 个 0. 

证明： 假定且设是 A 的奇异值分解.记 

■2 = O 风》‘》，。€ M ,„ „'„ ， 

其屮 Stdiagh , …，〜），并且把 两因子 写成 V =[ WV ; ], 其中 
如果令和#=疋八茂，则矩阵 

^ ^ "1 ^ 氣"， 0 e ■… 

Lw w 0」 

是 H 矩阵， fl 经&接 计算可以验证 - 

( ~S 0 01 

A - U\o -s o|[r ， 

lo 0 0_ 

其中对角零块是 (w —«) X ( m — ") 矩阵.如果 wi < n ， 证明是类似的. □ 

练习设是给定的矩阵 . E 明 A ' A T 和 A 的奇异值与 A 的相同.如果 UeM m 
和 vejw „ 是两矩阵，证明 lmv 的奇异值与 a 的相同.如果 ， ec , 证明 t . A 的奇异值是 A 的奇 
异值的 k | 倍. 

作为定理(？.3. 7 )的-个直接位用，我们有 X 任意矩阵的舒异值的一些扰动结果，这些结 
果是从 Hermhc 运阵的相应结果得来的.它们说明每个矩阵关于奇异值的计算是优态的，可以_ 
把它们同 （ fi . 3. 2)、（ 6. 3 . 4 > 以及其屮关于条件数的讨论作一比较.关于如何把这些结果推广到 
任意 W 不变范数，可参看 （7. 4. 51). 

7.3.8 推论设 A ， M ,„,„. E=B — A , [ J . iS min { w . «}. 如果 cr , …是 A 的 
奇异值，且…: s ： r , 是 B 的奇异值则 

fa) I 0,—r, I <. It E [| s 对所有 i = l, 2, ■■•, (/成 4: 

( b ) [ SU ] 1 .、|| K ||,. 

p -] 

证明：这两个结果类似于界灯1不等式[(4.3. lh 也可参看 （6. 3. S ) 前面的练习]以及关于 
Humke 矩阵的 Hoffmam - Wielandt 定理 （ fi . a . Hh 它们可 从所述结果及 (7. 3 . 7) 直接 得出.口 
练习给出 （ 7 . 3 . S ) 的详细证明.关 T ( fOa (5. 6) 节习题 3 fi . 

奇异值也有交错性质；它是由 Hermite 矩阵的特征值交错件质得来的. 

7 ‘ 3 .9定理设/是给定的矩阵，又设 A 是划去 .4 的任意一列后得到的矩阵.设 V ,}表 
示 A 的奇异值， {#, 卜表的奇异值，且都按递减顺序排列. 

( a ) 如果则 

(?1 > > ff：' > > ■■- > 1T„ 1 > (T„ (J. 

Cb ) 如果 mO ， 则 


ffl > tfl > ① > A > … > 0. 
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如果划£ A 的 一行， jTij 不是-•列.则相应的不等式可通过交换 ( a ) 和 < b ) 中的 w 和^来得到. 

证明： A 的奇异值的肀方是 Hermiter 矩阵 AMeH , 的特征值， I 衍 A 的奇异值的平方是 
A-AGM ,的特征值；如果划去 A 的一列， A '4 是 A ' A 的主子矩阵.交错不等式组可从包含 
原理 （1. 3. 15) S 接得出 . 如果划去 A 的一行1衍不是-列，则相应地 tlft AA ‘和 . □ 

作为 ikrmite 矩阵的特征值性质咭奇异值性质 M 的最后〜个类似，有与 Courant-Fiscber 
定理 (4. 2. 11 ) 类似的定理. 


7.3. J 0 定理 i ' iAeM ,,,. »} , 设① …是 A 的有序奇异值，乂设 A 是 

适合的某 t 整数.则 


II 



1| A.- II, 



. II Ar !t ； 

max nun ■^二 

〆.「 W C " II II 」 

n 4 

证明： 这两个公式接从 ( 4 . 2. 12) 和 U . 2. 13) 推出，因为是 A ' A 的特征值.如果 
ASK …; U 是 Hermite 矩阵 A * A 的有序特征值，则 M ( A ) = A „- it , ( A ' A ) ,而 (4 J .12) 说明 

^ (A) — A„-h 1 (A~ A) = min max 

- -■ ,uy L € C v j ■上 

(_ -U 1 , ，… .Uj 

二 min max 

-J'l tC"' 

J i W) 

ffl 同样的方法可以证明第二 t 恒等式. □ 

习題 

1 ‘设 PGM ,, 足半正定矩阵.证明 P 可以写成 F 的多项式，因此，如果某个矩阵 LJ 与 P 2 
可交换‘则它一定也与 p 可交换.用这个事实证明，如果 Aeiw „ 是正规矩阵，则它的极因子 
尸和【/可交换. 

2- 证明，仟意 A €! M „ 可写成 A = 其中 P , new ,,， p 是半正定矩阵，而 H 是 
Hennitc 矩阵.证明 J ~ f 可以取为正定矩阵. f 和 H 可由 A 确定到什么程度？ 提示： 如果 Ue 
M „ 是西矩阵，且 H -- V 2 V •是 L 7 的酉对角化，则 d 二 〆 .其中 D 是具有实主对角元的对角矩 

「」 M 阵.'是 什么？ 

3 - 证明 ， A 6 有零奇异值，当且仅当它有零特征值. 

.1 .设 A & M ,,,.,, fl f / = m inU ， 证明 A 的最大奇异值等于 A 的谱范数.证明 A 的 
Fmhnius 范数适合 悻等式 

ml - (iw 

r l 

证明 <7,4 :| A l |,< Vwi ， 并 II 确定便等式成立的条件.证明对所有為6财„有 
il A : l | 2 < II A |“<^,|| A | 2 ‘ 


/ il Ar |U a 


(7. 3. 11) 
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考虑 J 和说明 11 A |!2 町以达 到这两个界. 

5. 如果彳 m , nK fl 在 A 的奇异值分解 （7. 3. 5>屮，巧是 V 的第6列，比，是 W 的 
第是列，证明 

A ■叫了 和 .4 w /* = a t v t . 

其中的是 A 的第 A 个奇异值，特别是， 

6. 如果给出一个大矩阵 A , 如何用数值方法去计算 A 的秩呢？注意到 A 的秩等于 A 的非 
零奇异值的个数，于是，一种从数值上计算 . A 的秩的方法是.求#异值分解，然后取 A 的秩 
为大 T •某个限定值的奇异值的个数.如果 A 的最小非零奇异值与最大非零夺异值之比不接近 
于0,你为什么可以指望用数值方法确定 A 的秩会更容易和更 精确？ 

7 . 设八6蚪„,„冇竒异值分解.4二以识+,日定义其屮， r 是2的转置.且 
之中 A 的各正奇异值用它们的倒数来代替.证明， 

( a ) A/V 和 A 1 A 是 Hermite 矩阵； 

Cb ) AA—A = A ; 

( c ) A r AAW . 

证明，如果 A 是非奇异方阵，则二,4 1 .矩阵 A 称为 A 的 Moore-Pen ms (.广 艾逯 .对于任 
意矩阵 A ， 甚至于奇异方阵 A 和非方阵 A . 它们都有广义逆.再证明，按上述要求 （ H ) 〜 （ r ). 
A + 是唯-确定的. 

8. 线性方程组 A , = b 的最小二乘解是在使 | 丨 A . r ~ b \\, 为极小的所有向 tt . r 当中 . ..| ^ ||: 
达到极小值的向 II t 证明 . r - A ^ b ^ A , v ^ b 的最小二乘解. 

9. 证明 A ^ linL 4" ( A .4' - U /) 1 . 其中 A ’ 是习题7中所定义的矩阵. 

10. 不直接利用特征向 M 和特征值也可以导出奇异值分解 （？. 5 >. 回顾一下利用 

Ray I eigh-Ri tz 原理对角化一个 I lerm i t e 矩阵的证明，从谱范数的变分特征可以赶接构造出（左 
和右)奇羿闷量和奇异值.考虑 A 6 A 1 及变分特征 （** ) | A | 5 ： nmx { II |!， : II , rb - l t . 
( a ) 设乂设 M „ 有特殊形式 



其中① =|5心 wee 1 而 xeAin , 证明 w = u . 提示：如果的 > o , 考虑^^]/(以- 

w'u，) 12 , 证明 II W Wt 然后利用 （H). (b) 设 AeM„ 目 .(J,—A 然后利 

证明，存在某个单位向髦心使得 II An ^=£7,. 设乂三〆 1 /!々. （c) 设1^， W6A1 是 K 矩阵， 
它们的第 J 列分别是 r, ^ V,. 址明 KAW, 有谱范数 0 ,且有 U) 中的矩阵形式.由此得川 

AW, ^ [o xl ' ( d ) 通过引人非对角零元组成的列和行压缩 A , 用公式表尔这个归纳过程， 

左乘和右乘相应的两矩阵便可得到 A 的奇异值 分解. （ r ) 如果 A 6 M „,„ 不是方阵.情况乂如何？ 

11. 设/ \ = V 2 W ' 是矩阵_4 6对,_的奇异值分解，假定 A 有秩1 R 设 g = m i n { m ， 证 
明 W 的最后《 列枸成 A 的零空间的标准正交基‘而 V 的前6列构成,4的值域的标准正 


刚 
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交基. 

12. 证明 A 和的零空 M 的交的标准正交基由 W 的后若 t _ 列（有 

多少？)给出，其中是分块矩阵的紆异值分解.提示：对 ^ eC ’ 1 , 什么时候 
LB 」 

[^]*-=0?你如何求列数相同的4个矩阵 …， A , 的各个零空间的交的标准 JH 交基. 

13. 证明极分解 （7. S . 2) 与钎异值分解在容易相互导出的意义下是等价的. 提示：把谱定 
[422|理应用于 P . 

14. 设 A6M ,,. 证明， .4 可对角化，当且仅当存在正定 Hemite 矩阵 P 使得[是正 
规矩阵. 提示： 如果 AfSVlS-S U (用极分解 (7. 3. 3)于& 

15. 试用奇异值分解（ 7 . 3 . 5)( 特別是关于分解的唯一性的论述）以及推论 （7.3.6) ffi 明. 
丁吐吨;表示(4.4.4)对复对称矩阵成立.提示：若 .4= A r GM „ 有各不相同的奇异值14 = 
v ^ w ' ' 则另-力-面，存在-.个对角丙矩阵 D = diag ( f '" i ， …， A ) 使得 W 
=- VD , 故 A = V 2 W . = VI ：(? D )‘ .-- VSDVLCVDA ^ WWsUSLTT . 对于一般情形，把 
(7.3. S) 和选择原理 (2. 1.8) 用丁扰动， 然后取极限. 

16. 设 A ’ q = mm { m , n \ ,设 A 的冇序奇异值是〜（.4)；>“>%(.4)>0.类似 

地，设/纟和4也有冇序奇异值.设叉 . B . A 十是如 （7. 3. 7 a > 中定义的 llermite 
矩阵.证明，对卜1， 2 ,…，且对和 （A I m 也有类似的结果. 
注意：诸奇异值是按递减顺序排列的，而 Hermite 矩阵 A 的诸特征值是按递增顺序排列的. 
试 W 这个等式和 Wcyl 定 J |(4. 7) 证明 

tr Hj I (A 十 - B ) < cr ,( A ) 十 a 」（ B )， 1 y 和 / + j ^ + 1, 

特別地， a ] ( A + B ) s ：, a ] ( A )+, y l ( B ), (为什么这是意料之中的？)且 VA + BXmii 心 ,（ A ) Ud 

C ；1 ( A ) +心 （_ B ) }. 

17. □和 3 G D ， 证明不 -等式 + + 不是对所有， = 

1 ， 2 都成立.其中 U ( A )} 和分別是八和《的奇异值，且都按递降顺序排列. 

18. 设 A , BGAi ,, …是给定的， tf - minim , n \ , 设 A 的有序奇异值是〜（力）為… >〜（八） 
>0 ，和£砧,„的奇异值也冇类似的递减顺序 . 评明 

<7,. ; i ( Aa - ) i + j ^ q + l . 

这些不等式可以看作类似 f 习题 16 中的加法不等式的乘法小等式，当™。,时，它们也可以 
看作谱范数的次乘性质的推广.为什么？ 提示： 设=呢0是力 s ，的左极分解，其中， tv * 
GJW ,,, 是两矩阵， Q6M ,„ 是半正定矩阵.对任一个， CC "', 有 O ’ Q _ r) 2 = u .* = 

r(A*W,-)*(/r,-)T< II A-Wx |i ； |j B\r (W ^)} (:设 c … 以， 

_ 是 A / l . 的标准正交特征向量’它们对应于 A 4* 的，一1个最大特征值 …， WhCA )， 设 
1 ，…， A - iMiiiS ' 的标准 TH 交特征向量，它们对应于的1 个最大特征值 y ( B ), …， 

a > 1 ⑻，又设丄1=妒、， X ::— W 、， …， , r , = V , , j - I+1 =-- 3 ' 2 , 4,-.-:: 
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乂，.若对々 = 1, 2 ,….，+)_£， .r 都正交 丁-心，则 d ). AA '( W'rXd ⑷ IMIUm 犷 
.,<0抝 1| , HI _， 丙此.在这些限制下，我们有（， Q . rXdM )<( B ) || 上 IN ：. 于是引用 
Qmrant-Fisrlier 定理 (4. 2. 11) 便得出 

‘ “MT ) = (A„ 1 ^([(Air ) s (AB。]) 2 ))^^;(A)^(E). 

19. 虽然当,4, 时， AB 和 BA 的特征值总是相同的，不过例子|^ j 和 U 却 

说明， AB 和 R4 的奇 兒值 不一定相同.但是可以此明 AB 和 IT 的奇异值总是相冏的 ■ 

20. 设入'是《维随机向量，它的诸分 M 有零平均值和有限方差.设 2 = Cov ( X ) = 

E ( X . Y ' ) [见 (4. 5.3‘ ）], 假定2是非奇羿的，设尸二 2 1L> , M . A , 是给定的，随机向 M 

AX 和 iiX 有相同的 （零） 平均值向量，但没有理由指望它们冇相同的协方差矩阵.证明， 
C 0 v ( A ；0 = ( Jov ( BX ) 当且仅当0对某个两矩阵 L 7& M „ 成立. 提示： 若 AX 4' = 
B2B' , KAP )(/\ P )- =( BPKBD *. 如果尺 W 是的一个极分解，证明，对某个酉矩阵 
W , ve M „, RV ^ AP 的一个极分解， 穴是什 么？由此得出 A = B(PW^ VP~ l ) = 
BiPUP (7 可以确定到什么程度 ？若 2=! 乂如何？若乂如何？ 

21. 考虑由 


0 


Le 0 •••()」 

给出的矩阵 A . GR . 证明九的特征多项式是 r - s , 提示： 用沿其第1列的 Laplace 代数余子 
式展开计算 det (^- A £ ). 址明息的齐特征值是|的》个选择.证明 A s 的齐奇异值是 lh — 1 
贞） 和 e . 现在设》二10, £ -10 注总到扰动 A ,—.4, 引起 A , ，的各特征值一个 ().1 扰动，但 

只引起/ V 的任一奇沣值一个10 m 的扰动. A f 的谱条件数是什么〃这是关 丁定 理 （7.3. 下面_ 
的沦断 的一个例子，改论断是说，每个矩阵关于奇异值的计算是良盔的，而一个给定矩阵关于 
特征值的计算可能是病态的. 

22. 设 A =「~ l £ M „ 是给定的.证明，若/\冇“小”行或列，则 A -定有“小”奇异值.说 
得更明确些 . @A = Lr , yr „ J \ 其中 rec ", 且 d 是 A 的第,'行.用递增顺序排列各行的 
Kudic ) 范数彳 || r , !U ; = 1,…，„}，沣 R . ffl …表示所得到的有序值.证明 

I' _k_ 

^^ . 1 < 2 ' A — 1*2 .…， n ! 

一个类似的上界可用列范数灰示.沣意诸奇异值是取顺序提示：平方奇异 
值是 Hermitc 矩阵 A / V 的特征值.的各主对角元是什么？用优化和定理 （4. 3. 26 ) .义亍 
列和不等式考虑 . VA . 与 (4. 3) 节习题19比较. 

23. 有一个与奇*值分解类似的自然分解，其中的酉 W 子用复正交因了-来代替. f 曰是 ，与 
奇异值分解不同的是，这个分解不是总能实现的：从 （2. 3>节习题7可以想到，类似子 Schur 
n 卜三角分解的 iF 交分解也不是总能实现的.如果以写成 A = PAQ T 的形式，其中 
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PeJW , rl 和是复正交矩阵， 而 时有; U=0 的意义下的“对角”矩 
阵，证明 A4 T eJW,„ 是可对角化的且 rank A-nmkAAT. 这两个条件也足以确保所述分解 A 
= _PAQ T 的存在性.如果 A 是实矩阵，这指的是什么？给出一个 A6iV^ 的例子，说明它不能 
写成 A = PAQ t , 其屮是复正交矩阵，而 aeM 2 是对角矩阵. 

24. 说明奇异值分解为什么可以看怍正规矩阵的谱定理的推广. 

25. 关于正规矩阵交换族 N 时西对角化的定理 (2. 5. 5) 对于奇异值分解有一个类似的结果. 
设.圯4匚虬,„,假定存在西矩阵 veM „, 和使得每个是在习题23的 
意义卜(即在/句时其;_， J 兀为 0) 的“对角”矩阵，证明， （ a ) 每个是正规矩阵，且 

[4251 ；={A r A； : 是一个交换族. （b)A,A;A, = A tJ 4;_A」 对每个 j, 成立.这 

每一个必要条件也是族有奇异值分解形式的同时分解的充分条件. 

26. 求两个给定矩阵 A, 的奇异值分解形式的同时分解是前一个习题的一个有意 

思的特殊情形.证明，存在西矩阵 VeAC,，WeM„ 使得 A=V2W+ 和 B = WW ■(其巾 A 
6JVU, 是“对角”矩阵）当11仅当 Afr 和 fTA 都是正规矩阵. 提示： 为了证明该条件是充分的， 
可证明只要考虑 A — 2是非负矩阵又是“对角”矩阵的情形.若把 i： 的相同对角元排在一块，证 
明，若 2R' 和广 2' 是 IF 规矩阵，则 B 是一个分块对角矩阵，其中可能除了一个子块以外（若 
/V是夺异矩阵)所有子块都是正规矩阵.对每一个子块，或者用关十正规矩阵的谱定理或者用 
奇异偵分解便可得到结论. 

27. 如果我们希望有酉矩阵 V6M,,, 和 WeH 使得族 ?=(A r =斤4 CM,,,.,, 中的每一个成 
员都吋 以写成九=^,『，其中每个怎都是“对角”矩阵，证明，对每个 ； ， if./, A, A* eM,„ 

都是正规矩阵的条件是必要的，但是当该 族有二 个或更多的矩阵时，它不是充分 
的. 提示 ：考虑 


叫 [: I [: :], 11 I 

当该族的矩阵多于两个时，说明关于两个矩阵情形的证明中的哪个部分行不通. 

进一 步阅读与注释 Sylvester 于18帅年跖明了关于实方阵的奇异值分解.关于一般的 
Xn 复矩阵的奇异值分解的最早证明似乎是在下文中： C . Eckarl and G . Young , "A 
Principal Axis Transformation for Non-Hermitian Matrices ," Bull . Arner . Math , Soc . 45 
(1 S 39), 118-121. Eckart 和 Young 的文 t 也包含了如下结果：两个矩阵有奇异 
值分解形式的同时分解（其中的相应“对角”因子都是实矩阵）当 ft 仅当 AS ’ 和 A 都是 
Hermite 矩阵.关于矩阵族有奇异值分解形式的同时分解的诸多结果的一个综述以及更多的参 
考资料可参看 P . M . Gibson , " Simultaneous Diagonatization of Rectangular Complex 
426| Matrices , Algebra Appl . 90974 ), 45 53 . 

7.4 奇异值分解的例子和应用 

极分解和奇异值分解有许多应用.-些应用在习题中给出，而一些应用在下述例+中 
H 论. 
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7.4.1 例如果是给定的可逆矩阵，则（关于任一 范数） 与 A 充分接近的所有矩阵也是 
可逆的.在某些统计模型问题中，需要求一个在最小二乘意义下与最接近的奇异矩 阵”； 也 
就是希望求矩阵^使得 A + B 是奇异矩阵，而|| 越小越好. 

设; jlj 是任 一矩阵范数.考虑假定它是奇异矩阵.假如 1 B ll ,< 

1,由 （5. 6.16) 可知， i+A ' B , Wlfij A + B 是可逆的，于是 1 <』A 1 B ||<||. A _ ^ | B ||,因此， 

如果 A - fii 是奇异矩阵而/ I 是可逆矩阵，我们就一定有 ||| B ||:>1/|[ A _'|||. 如果选 IH , 为谱范数， 

乂如果 A = V ^ W . 是 A 的奇异值分解，则 |1 力 '| u = ii ^ ' V*|-|iZ '1 = 1/^, 其中〜是 A 
的最小奇异值.于是，使得 A + B 是奇异矩阵的任何 B 必须适合但是，如果选 
择 ii 为矩阵 ，其中 E = ciiag (0, 0,…，0, 一 〜），则| B | =|| =〜=1| £ h = 

I 1 B ||=. + B 就是奇异矩阵(有秩 rr -1). 

更一般地，如杲关于 Frobmms 范数需要求-个与某个奇异或非奇异矩阵 A " 最接近的秩点 
矩阵”，可以这样选择 A + fl , 其中 B = 如前，似是 E = di ag (0, ...， 0, 

一〜）.关于这个结果从 Frohnius 范数到所有两不变范数的推广，可参 看本节 末习题1的有关 
证明以及例 (7. 4. 52). 

^=1的情形经常出现在一些应用中，这是值得特別提出来的.用秩1矩阵 XGM „ 对某个 
矩阵 A = V 2 W ' eM „ 的最佳最小二乘通近是叉=八+/3二 E)W =Vdia S ( ai , 0, •••, 0 ) 

,其中 ，〜是 A 的最大舒异值，而 V 和 W 分別是 A 的奇异值分解中的酉矩阵 V 1 
和 W 的第1列. v 和 w 的一个有用的论断是， I )和 w 是 -- 对 Hermite 特征值…特征向量 
问题 

AA~ v — oiv^ Aw = o S ]W 

的单位向量解，其中 i 是半正定矩阵 A ‘ A (和 AA *) 的最大特征值.这个论断当然不唯一确定 v 
和 KN —个困难是相应于 d 的特征空间不一定是一维的.但是，如果4是 A +/ U 因而是 AA ，） _ 
的单特征值，则向量^和可确定到相差模为1的纯量因子，因此，■^和 w —定是奇异 值分解 
A = V _ SW ‘中两矩阵 V 和 W 的相应第1列的纯 M 倍..在这个意义下，关于单位特征向和 u , 

的确定选择， A 的最佳秩1逼近必定是形式 〆 ^ vw / ，其屮 (?6 R 是某个实数.我们必须选取 
纯 M 因子 〆 使得 II y - || A || =-2 a , Re [ tr ^ )']+^ IU ll?IU II ? 为极小， 

问题等价于使 ReOe )' ] = Re[f %'Au ， ] 为极大 . 但是， AwVSW 比一 〆 〜 tj 对 

某个成立 [ 见 （ 7.3) 节习题 5], 因而 | V Aw | =(^>0. 因此，最佳纯量囚子是 〆 二 
V ， Aw! I rr Awl =r' Azc/ff,, 而对力的最佳秩]逼近是 
fVi * — (v' Aw)vw', 

这说明，如果 / TA 的最大特征值是苹的，则对 A 的最佳秩 1 最小二乘逼近可以毫不费力地通 
过两个 Hermile 特征值问题的解构造出来 • 例如，使 AA ( 为正矩阵，或更一般地为不可约矩 
阵的任一非负矩阵 AeR ( R ) 就适合 A ' A 的最大单特征值的条件[见 (8. 4) 节习题 17). 

7.4.2 例在定理 (5. 7. I 7 )中已经证明， JW „ L 的向量范数 G (.) 能使条件 

GCA] )G(A 2 )--'C(A*) ^ f)(Ai … A) 
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对所有 Al A 3 , …， AiGM ,」 和所有4 = 1， 2. …成立，当万仅当 G (‘） 在 C 上有相容 向镇范 
数.在这个证明中，决定性的一步是证明，如果 G (0 满足这个关于谱半径的不等式，则有某 
个有限常数 <'>()，使得 GUJGa 少 " GAdAllAMrAd , 而证明它的关键是乘积 AA 
…4的竒异值分解.其细节在引理 (5. 7. 16) 中. 

7.4.3 例 假定想解线性方程组 Aj ' = 6, 其巾，.46喊,,.„和66<：™是已知的，||_有秩夂如果 
A = V 2 W * 是 A 的竒异值分解，则 = h 或 

2(1 V ^) = Vb (7.4. 4) 

如果则2的后 m — A 行是0,因此，如果在这种情形下有解，则必须（同时也只须）使 
[428] V ’ 6 的后 m A 个元为零.丁-是，方程组在 m >6 时有解，当且仅当6与 A 的后个左竒 

异向量正交.如果6满足这个相容条件，又如果 V — [切•■■%]和 W = [ toi …机 J , 则 （7.4.4) 
说明 

( W * J -) * ■= 「 办 ，…，… , o ] , 

L cti a k J 

因而向蟥 



是解.因为对所有 _/>L 所以， A 的后个右奇异向 M (如果有的 

话）的任意线性组合都存: a 的零空间中， 因而 对任意 t ,, ec ， 向 M 

.■ = X — | S ㈣ 

r- I r- t-] 

都是 At =/; 的解：当然，如果就不会出现这后一个和式-因为向量组 b ,,} 是标准正交 
组，所以当所冇时，就得到具冇极小4范数的解.值得指，屮,的是， A 的后 W ，— A 个左奇 
异向量张成 AA ' 的零空间，它与 A 的零空间相同，因此，要求6与 A 的后 m — 6 个竒异向量 
屮交与要求6与 A '/=0 的每个解正交是 ■■回 事. 

练习如果 V 6的后 m — 6个元不全为零，则方程组 = 是不相容的，因而根本没有 
解，但是，为了某些 R 的.只需 要有“ 最小一-乘"解就可以了，这个解是使 || Aj — 6|| 2 达到极 
小的，具有极小^范数的向量 a 证明 （7. 4. 5) 给出这样一个最小二乘解. 

7 .4.6例用西矩阵的纯量倍对某个矩阵 AGM „ 的最佳最小二乘逼近是 什么？ 我们知道， M „ 
上的乙 范数是由内积 [ A , B ] 二 tr AiT 诱导的，还知道，如果 L ； 是酉矩阵，则 
II 17 II ： — i _ L /,[7] — tr ULT = tr I — n 
对任意 c ^ C 和任意酉矩阵 R ，有 

II A - cU II ；- [ A - d /. A -,-[；] = m 2 R e U :[ L “ I t . I 、 

当 f = 时它达到极小，因而 

_ Mlli- ^ ! [A ， u.|p. 

如果定义 
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u(A) = max i [.4,[/] I . (7.4.7) 

fUtBCf 

就得到一个与数值半径 r(A) 类似的鼋.对于 r(A), 内积的极大值不是针对两矩阵来取的.而 
是取遍所有 Frohcnius 范数为 1 的秩 lHermhe 矩阵 . 但是，与数值半径不同的是，阐数 《(A) 
是 M„ 上的矩阵范数[见习题 5 和例 （ 7. 4. 54)1. 

要确定 k (A) 的值与欲求的酉矩阵并不闲难.设 A 的奇异值分解是 A=V2 研•.则 

u(A)~ max I |- max | ,iQ ! 

两矩 eu; HS'ffi' 

— max I tr VSWU' I = max | trKWU'V) \ 

AS! 阵 fiSi 阵 L_ 

但是，如果 A=PUMA 的极形式.则 

[A,U] - ir R/LT = xr P = 

J J 

因此，所给出的"(，心的上界是可以达到的. u (」4)=<r, (.4> 丨…+〜（4). 乂如巣 A = PL/ 是 .4 
的极形式，且 a . 是它的奇异值，则用一个酉矩阵的倍数对3的最佳最小二乘逼近 
可由 

1 + … +<J„}U 

n 

给出.如果给定奇异值分解则(：/=7见*,该 M 近的误差是 

| 卜-¥山’ | II - 4 II 卜士 I 卜 ☆ - +(自幻、 

R 有当 Cauchy-Schwarz 不等式 

是等式时误差才为 0. 因此，只有光 A 的所有奇详值都相同时， A 才可以用一个酉矩阵的倍数 
来完全 逼近. 

7.4.8 例假定 A， 月6«„,.„是给定的矩阵，而我们想知道，是否可以通过'‘旋转， ’S 來得到 A ; 
即/ \ = UB 对某个酉矩阵 U6M,„ 成立吗？更一般地，如果考虑巳知矩阵 S 的所有可能的“旋 
转” 1/方，在最小二乘意义下，可以怎样充分地逼近 A? 这个问题在凶子分析屮称为求石的一个 
“强行 （procrus u 泡 n ) 变换”问题. 

要做的计算与上例中的计算是类 似的； 我们试图选择 [7 使 || A-UB II,达到极小，如前， 

汁算 

il A-- l/B I? = [A- || A ||?- 2Re[A,UB] |- || ii ||L 

于是 . 必须求使 Ke[A, UBhRc tM/T [/" 为极大的两矩阵 (J. 如果 =V2W • 是 AB 的 
舒异值分解.则 


國 




第 7 章 


Re XrAiriJ^ - Re tr = Re ir SW^U^V 

= j, (ab *) ；„ , 

其中 T '= UJ = W 1/' V 是两矩阵.当所有即当时，这个和取 极大； VW f ]E 
好是 AB _ 的极分解的酉部分. 

闪此，用形如的矩阵对的最佳最小二乘逼近由 [/B = (VW )B 给出，其中 B 
而 (7 eM ,„ 是酉矩阵 ， Afr 是 AB ' 的奇诗值分解，或 Air = p ( vw ') 是 

AB' 的极分解；我们并不需要分別知道V和 W. 这个通近的误差由 
min{ || /I - UB II , ： LJ e M,„ 是酉矩阵}= |_A(VW )fi ||, 

=[II A ||S+ II B ll^-- 2 2cr,(AB *)]'' 

给出，其中 )} 是 Air 的奇异值的集合. ' 

如果想知道 A 是否恰好是《的转动，则 一个明 M 的必要条件是 II A II B IU , 而其必 
要充分条件是 

IM!I^= tl B||^ |>,( 仙.）， 

其中 k(Air )} 是 AfT 的奇异值的集合. d 

ft 后，如果考虑，》= »及 H = / 的特殊情形，便冇以下事实：用 H 矩阵对给定矩阵 
_ AtAi , 的最佳最小」乘逼近由 [ hVW ' 给出.其中是 A 的奇异值分解或/\=/^二 
是 A 的极分解；通近的误差是 

I! A - VW' ||^- Mil" II /"?- 皆」⑻ 

= — 2 士 。, (A) 二 2 (。 (-4)— 

其中 U ( AV f 是 A 的奇异值的集合. ^ ^ 

如同上例中的讨论部分，在所冇 W 矩阵 U 上求使 Re tn 4 L 7 为极大的问题的解.为了以后 
参考方便，把这个结果概括成 T 述定理. - 

7.4.9 定理设 AtM ,, 是给定的矩阵，且欠=^识‘是 A 的奇异值分解.耶么， U ) 问题 
max { Re tr AV ：U ^ M „ 是酉矩阵} 

有解(7=见1/-，且极大值是 a ( A 〕 + …+〜 ( 力），其中 ( d 4 M 是 A 的奇异值集合. （ b ) 存在酉 
矩阵 U^M„ 使得 AU 6 M „ 是半正定 Hermite 矩阵. 两矩阵1/是便 < a ) 中问题达到极大的矩阵， 
当且仅当 AU 是十:正定 矩阵； 如果 .4 是非奇异矩阵，则 L / 是唯一确定的. AU 的特征值是 A 
的奇异值. 

证明 ：计算 

Re tr AU = Retr V 2 W'U = Re trS ( W ' L / V ) - J^Ke <j,(W UV)., 

它只有当所有 （ H ^(7 V )„ 二 1 时才取极 大倌. 因为圯+ 是酉矩阵，这又当且仅当识 •[/¥=/ 
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或 U = 时才成立.对于 U 的这个选择， AV = V 2 W ' WV ' =VIV , 乂 W 为 2 = 

…，所有1^0,所以 At / 是丰正定 Hemiite 矩阵.如果 [；, 6 M ,, 是使 AL ^ 为半正定矩阵 
的任一酉矩阵，因为奇异值是酉不变的，所以 ALT , 的特征值是 A 的奇异值.对 A 是非奇异的 
情形， U 的唯一性可由 （7. 3. 3) 的唯一性部分推出. □ 

对于任意矩阵 AA •以及 AVI 都是丰正定矩阵，并且 tr AA * =tr A*A = M ( A ) + 

W )» 因 f 与力 有相同的奇异值，所以 tr A/r ffT 看作 A 和 A ' 的相应奇异值的乘 
积之和.这 t 简单的论断可以推广到任意一对矩阵 A 和 B ， 只要乘积和5力有定义 a 为半_ 
正定矩阵.这个结果对研究几种类型的矩阵最优化问题有用. 

7.4_10 定理 ig AGJW ,„„. , H (；^= min { m , n ). 设 (^( A )， …， 6( A ) 和 ( B )， …， 

tr / B ) 分別表本4和5按递减顺序排列的奇异值.如果 ABeM „ 和是 f ■正定矩阵. 

则存在整数1，2,…，的一个排列 r ， 使得 

tr AB - tr BA - (7.4. 11) 

! = J 

证明： 如果 m = «， 且 A 和 S 都是肀正定矩阵，又如果 A 与 B 可交换 ， 则它们可以同时 
两对角化为 A=-IMLT 和 S = UMt /‘ ，其中，是西矩阵， A - diag ( A ,, A ,„) , M = 
diagb ,, …，且所有 ; U p 都是非负的.这时，有 

tr AB = u(UAir ) W ! vlV ' ) - tr UAMLT = tr AM = 么沪,. 

闲为特征值 A ,， p 也是 A 和 B 的奇异值，所以在 m = n 的特殊情形，定理得证. 

不失一 般性， 假定因为，如果/«>«,只要在定理的叙述中互换 Z 和 S 就可以了. 

为了证明定理的一般情形，只须证明，对任意一对使得以及 AS 和都是半正定 
矩阵的 A 6 M ,„.„ 和存在酉矩阵 V 6 M ,, 和有标准正交行的矩阵 yeM „,,„ 使得变换 

A - y-AV 和 6 = V-BY ( 7 . 4 . 12 ) 

能得到一对可交换的 f 正定矩阵 A 和在这种情形，由 J ： 述结论可知 
tr AB = tr ABYV = tr V ABY = tr ( Y ' AV )( V * BY ) 

= AV ) a rl AV ' BY ) = ( B ). 

J ^ 1 ^ I 

注意到力’汲= >-‘4''1 7 广47=\^/1.14^=(.4\0 > (4\0，于是， A 的奇异值与 AV 相同， 

因为 （ AVO ( AV )'= AA ，所以它又与 A 的奇异值相同.同理可证的奇异值与 B 相同， 

由此可得 


tr AB = 園 

这正是所要求的.现在分三步来证明，存在形如 （7. 4 .〗2>的变换，且具有所要求的性质. 

(1) 设 A 和 B 适合定理的假设.由 （1.3. 20) 可知， BA 的特征值与 AB 的相同（重特征值按 
重数计算），再加上 fl _ m 个零特征值.如果 Al ，…，1是/\£的特征值，且 A 二 dUga , …， 
心），因为由假定可知_/^和似都是出^1如矩阵，所以有酉矩阵(7 6财„和1/6财„使得 
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AB - UAU ' 和 RA = °lv . 

Lo oJ 

若 V 写成分块形式 v =[ wv 2 ]， 其中则％是具有标准正交列的矩 
阵，因而 v , 1 V 〗 = 于是 a = lt 且 zMsV ^ v ; ， 故 BA =( v,tr MBa / v /). 设 

y ^-- UV ； eM „„„, 并且注意到 FT = UV { V 1 U ' ^ UU - = i , 则 Y 有标准正交行 H BA = 
Y - ABY . 令 A=：r AeJVT , 和 A = BYeA /,,， 算出 AB = 广 BA 及 ftA = BiT，A = RA : 

根据假定，乘积汉4是半正定矩阵. K 此有形如 （7. 1.12) 的变换（其中 V =/), 它使我们得到 
一对可交换的 " X „ 矩阵. R . 它们的乘积是半正定矩阵.但是，单项 A 和6可能不是半正定矩 
阵； 不过，我们可以进-步要求形如 （？. 4. 12) 的变换达到这个条件. 

(2> 不失一般性，现在可以假定 ， m = n , A , £1£財„可交换， R 乘积 -4 B 是半正定矩阵. 
如果且 j -^ o , 贝 iJ ( AB )( A r )= J 4 R 4 J = AABj ' = A ( AR [.)=/ Uj .= J UA _ i -)， 所以 
Ilermite 矩阵 Afi 的每个特征空间在,4作用下不变.同理可证，这毎一个特征空间也在 B 的作 
用下不变.因此，&11果卩=「〜...„„]是以的特征向量为列构成的丙矩阵，且相应于的 
同一特怔值的所有特征向 M 相邻地排放/ 七 一起，则 U ， AU 和 U * 万[/一定都是分块对角矩 
阵.且 

/\ = U' AU= dmgU],/!〆-.，/!,)， £ = V' BIJ = diagCR ， B” …， /U , 

其中， A, B, 6 M* , k, (-•.. + 々,=”， 且毎个 ， 另外 1 ， A” 

…， A , 是半正定矩阵 AB 的不同（非负）特征值. 1 

(3) 不失一般性，现在可以假定， A , £^灿„可交换， AB = XJ , 且 A >0. 如果 
0. 则 A 和 E 都是非奇异矩阵，且 B ^ AA - 1 ‘利用 （ 7 . 4 . 9) 求西矩阵 L / eM „ 使得是 
半正定矩阵.另一方面，因为 A >0, 所以 A = L ； HLf*A ' sACAL /)- 1 也是半正定矩阵，因 
_ 而 ( AU ) - 1 是半正定矩阵.此外， （ tTB )( AU ) 二 LTAfL ； 二 A /^ ABsfALOCLTIi ), 所以 A 与 
R 可交换.这是形如 （7. .1. 12) 的变换，因此.如果 A >0, 就完成了证明. 

如果 A = 0, 则 AB = RA ^0. 再选择西矩阵 (7 使得 AU 是半正定矩阵.于是0二 AB = 
( AU)W B )=--( U ' B )( AU )=^ U l ()U = 0. 因而 AU 和 LT 可交换，且 H er mit c 矩阵 A[J 的每 
个特征空间在[厂 B 作用下不变，若 ▼ = 是以， 4 U 的特征向量为列构成的酉矩阵，且 

相应于 A [7 的同一特征值的所有特征向量相邻地排放在一起，则 V ( ALOW 和 W , ( L /' B)W 
都是分块对角矩阵，且 

w ' <AU)W - diag(Ai r --,A r ),W (U' B)W = diag(Bj ， … ， R ,)， 

九和 H, 是同阶矩阵，而 A=A,/，！ = U £ ，…， r， 其是 A,， ，…， A ,. 是半正定矩阵的 
不同（非负）特征值-对 所冇； =1，…， r, 我们有 713, = _B,A ,=0. 如果九古0,则人 U 和 
B,=0 是一对可交换的半正定矩阵，这正是所要求的.如果 a ; =0, 则 B, 不一定是零矩阵，但 
是，存在酉矩阵^/,使得[/,+ _0,是半正定矩阵[应用（7.4.9)于召.」， H jfij-, 在这种情形，九 U, 
= 0和构成一对由形如 (7. 4. 12) 的变换得到的可交换半正定矩阵.这样，对所有可能情 
形都进行了验证. Q 

7 . 4 .13 例作为 (7.4.8) 中旋转问题的变形，设给定的矩阵，并且我们希望确 
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定.是否可以通过 J3 的两侧“旋转”来得到 A; 也就是 A = 对某两个丙矩阵[: /6M„, V6 

对„成达吗？更一般地.如果考虑 C 知矩阵£的所有可能的两侧“旋转 ’tWF, 在最小二乘意义 
下，可以怎样充分地逼近 A? 

如前，我们试图选择使 II A —UfiV|| 2 为极小的两矩阵和 V6M,, 还和前面一样， 

算出 

M — UBV ||S = U- UBV r A - [JBV] = IM II 卜 ZRe[A ,UBV~\ + || B ||L 
W 此，必须求使 RcrA ， U/3V] = R r tMV'JT [J+ 为极大的两矩阵 LieM,„ 和 VeM „. 使这个 
M 题冇极大值的酉矩阵 U>. % ' 定存在 ( 但不一定唯一），这是因为 JW, 中和 m ,„ 中酉矩阵的集 
合是紧集，乂紧集的笛卡儿乘枳也是紧集 . 使上述问题为极大的矩阵 K 对任意 两矩阵 [/ 
e.M „ 冇性质 

Re tr(AV ； ij- )U ； ^ Re trC^V ； B' )(7, 

于是，由 （ 7, 4. 9) 可知， ^V ； H' U ,； 是半正定矩阵 . 同理可证，对任意酉矩阵 V6M „， 

Re fr AV ； n ' U,： = lie tr(B-U： A)W > Re tr U； AV 
亍是.仍由 （ 7 . 4 .S) 可知， B-V t ； AK 是半正定矩阵，这样，两个矩阵 AV; 6 

M„. „ 都适合定埋 （ 7. 4 . 10) 的假设，因为奇异值是 K 不变的，因此，如果 (/ = mi 幻 m ， 则对 
整数1，…， g 的某个置换 T .有 

max{Re trAV B*L/* : 和 V^M,, 是西矩阵 } 

—Ke uAWa ； = : W,,(iT W (A) 而 , ，（ i!〕. 

不失一般性，我们把奇异值 tT,(A) ， ... ， <7/4) 和的（川， ... ， <r a (S) 按递减顺序排列.如果置 
换 r 不是恒等置换，则有适合的指标使并且容易验证，如果 
所作置换互换这两个奇异值的位置，则和 ' 

^>,(A)<r r ⑺⑼ 

不会减小，事实上，新和值与旧和值之差是 

「' (,4) —' ( B ) — !T Ti[i , (ii)] > 0. 

因此，对恒等置换 r. 上述和达到极 大值. 并且可以得出 

maxi Re trAV : U £ M„,，V e 风是酉矩阵 } = (7.4.14) 

其中 A 和 B 的奇异值都按递减顺序排列. ，_1 

把这个结果用到与初求极小值的问题中，对 A，R6JW_, 7 二 mid w , 求得 
min{ || A ■- UHV 6 M,„ 和 V G M„ 是酉矩阵} 

'[II A li~~2^,<Ab T (B) + i| H ||^] 1 '- 
= [2<(A)- 2^a,(A)a,(B) + 

3 ;] i -i ,= 1 J 
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國 ： [ Sh ⑻-以 (7.4.15) 

特別是， A 是 B 的两侧“旋转”，当且仅当 A 和 B 有相同的奇异值集合. □ 

练习 如果 (7.4. 15) 说明什么？试与例 （7. 4.8) 末尾的结果相比较.如果 B 是秩走 
的对角矩阵. （7.4. 15 H 兑明什么？试号例 (7.4. 1) 中的有关说明作一比较. 

7.4.16 例怍为利用奇异值的另一个例子，我们考虑刻划矩阵的酉不变范数的问题，它是在 
(5. 6) 节中提出来的. 

定义 Km 上的向量范数 HI 称为酉不变的，是指 

l | t / AV || = || A || 

对所有和所有 丙矩阵 L/eMp 成立. 

如果是给定的矩阵， = 是 A 的奇异值分解.则 || A II = II VSW - II = 
II 2 || 对任意酉不变范数 IH 成立.因此，某个阶数的矩阵的酉不变范数只与该矩阵的奇异值 
集合有关. 

两个熟知的两不变范数的例子是 FrobeniusCEnclid ) 范数和谱范数.如果 X = [xj e M lri ,„ 
的奇异值是 会 … (g = min { m , n }), 贝 lj 

llxlh = (SS l . r , I 0 1 -必广， 

厂 1 r-1 e = l 

fl 

1^ ! |, =■ n „ V ax --| j ^| t | L =[ 〆 『 A )]。-<7, - maxU , 

对于 M ,„.„ 上的一般酉不变范数 HI , 它对其自变 M 的奇异值的依赖关系是容易确定的. 
为方便起见，假定设 A ^ cUagU ,, J 2 ， …， . r „,) eM ra ,然后定义分块矩阵 
x = [aio], A e M,„ , oeM,„‘". 

因为 xx * =(〗 iag ( In i S U 丨 2 ,…， U „ I :),所以 X 的奇异®集合是 U } = { I j ., I }. 
如果定义函数 ^ C " 1 — R 1 为 

尺 (j.) = = [| X || , . 

则函数 《_(•) 从范数 ||_| f 继承了某些 性质： 

C 7.4.17) 毛心）>0对所有 _ rec ” 成立，因为 II X II >0对所有 xem 
_ (7.4. 18) = 0 当且仅当了=0,因为 II XII =0当 a 仅当 ； f = 0. 

(7..1. 19) g ( a ^)= I a gU ) 对所有 x 6 C " 和所有 a eC 成立，因为 |UX || = „ I || X || 
对所有 aec 和所有 x ^ m 成立. 

a 4. 2o ) 对所有 , r , y^r 成立，因为 || || < || x |j + || y [| 

对所有 X ，汗 

这四个性质说明 #•) 一定是 < r 上的向量范数，但是发(，）另有两个附加性质： . 

( 7 . 4, 21>正如 （5.5.9) 中所定义的那样，及 （_) 是 C •上的绝对范数；也就是说，如果 
. r = w ] ec , a v = b ,]=[ I j -, I ] ec % 则片⑺少.这是因为毛心 ；>=|| x ii 只与 x 
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上的击 R 1 值 CT , = I A 

(7.1.22) 如果 PfM ,,」 是晋换 矩阵，则 〆 RH — gU ) 对所有 _ reC " 成立，这是因为 X = 
: AIUI 的奇异值集合与 [ P .4 0] 相同，这又因为 （ PA )‘ 函数 gCdH 是 
^的各分量绝对值的集合的函数，无需考虑它们的顺序. 

练习试计算矩阵 X =[ AI0 ] e , W ,„,„ 的一个明显的奇异值分解，其中 AfciiagU ] ，…， 
X,,,), 刚才 i 彳论 /这样的奇异值分解. 

练习如果 /?!>"■ 设 X 二 [ AI 0] r , 其中 A = diag (』，. …， . r „) G M „ ,且定义 #(丁）= 
|别1, , r € C . 如果 IN 是 卜的 丙不变 范数， 证明， g (*) 是 C " 上的绝对向 M 范数，且 
片 ( Rr )= d . r ) 对所有 - r 6 tr 和每个置换矩阵成立. 

练习茛接证明，由 Frobenius 范数和谱范数诱导的向景范数适合上述（7.」.17) 
(7, 4. 22) 六个性质. ' 

7,4.23 定义 函数 e — 称为对称度规函数，当 H . 仅当它适合上述 （7.4. L 7) 
(7. 1.22) 六个性质.即气且仅当 “•） 是绝对向量范数 H W *) 是其自变量的诸坐标的置换不变 
函数. 

我们 L 1 经看到，上的毎个酉不变范数诱导 •个对 称度规函数；史有趣的是其逆命题也 
成立.下面的定理说明，似_上的函数是酉不变范数，3 II .仅当 W ( A ) 是 A 的奇异值的 
对称度规函数. 

7.4.24 定理设 IH 是 M,„,„ 上的西不变范数，并 - 且 r/ = tninWL n }， 设 ,r — . 「 .r,1 & C ; 和 X,= 
diagfj-,, a), 当 时，设 ： ^=[1 0 」 eM „.„, 或丐 时设久三「又丨 0] 1 6A1_. 

设以 CH 义为 M_r)= || A || . 则 g(*) 是对称度规函数 . 反之 . 如果以 R 是给定 
的对称度规函数，乂如果 IH: R' 用 II A II = S (L<^, … ，。 ,] 7_ ) 来定义 . 其中,…， 

，是 A 的奇诗值，则 !| • 卜是 M 上的酉不变范数 . 

证明： 前一个论 断已经 证明.关 f 逆命题.我们注意到，因为 g(_) 是其变量的诸分量的 
置换不变咗数，所以 IN 是 M 上有明确定义的函数.由于矩阵的奇异值集合是酉不变的， 
所以. 对于所有酉矩阵 L/6M ,,, 和，坯有 || UAV || 一 || /\ || . 因为 ff(，） 是向量范数，所 
以，对所冇 AeJW„,,„ 都有 | A|| >0,并 El ll Ai| =0当且 仅当# [的，…，〜」 1 ) = 0, 而这又当 
R. 仅当所有^=0才能成立.这是因为〆 •> 是正定的 （7. 4. 18). 但是零矩阵是所有竒异值都是零 
的仅冇矩阵，丙时函数|卜|!是正定的（见5.1.1(1 8 )).因为 U' | a ,( A ), 所以 ||M || = 
K([ k I ，…， I <- I 〜]「）= U_ ; ^([(T! ，…， （T,」 1 ) 二 U I ;l A II , 因而 HI 也是齐次的. 
至此. Q 经证明用对称度规函数这种方式诱导的任意函数 I 卜 || 是财_上的准范数[阽 
剩下要证明的是||_|:适合-2角+等式，为此，只需证明|卜 || 是准范数的对偶范数， 
[参看 （5. 1. 12) 下面的讨论 J 因而它^不上也是范数. 

考虑 O 上范数以*)的对偶范数 〆 （•）： 

(yj = max Re y' t 

W 为准） 范数， 所以函数 〆 '(■) —定是 ' 范数； W 为 yo 适合 （7. 4. 21), 所以， 
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(7. 1.2广） 如果 £= di ag ( 〆 ] ， …， A ), a 所有贝！ （ 

g D (E>.)= maxRe (Ey)* jr = max Re 3 1 ' (Kr) = max Re j* j ： 

山 > _ 1 jf( J-) = 1 iff ti-1 - 1 

=maxRe y\r ^ v). 

j " 

因此 〆 （•） 也是对称度规函数.从而 〆 也适合 

( H 22。 同理可证，如果是置换矩阵，因为 g (_) 适合 （7. 1.22)，所以 
^ D ( Py ) ― maxRe (Py ) f jc = maxRe v* P t jc = max Re v* ^ 

1 W!) I *t(t> 1 " 

二 maxRe d l 2 g D (y). 

这样，我们可以作 M „ 上定义与对称度规函数; ；■〃（.） 相关联的函数 II-IJ 

k : 中 < r ,. …，，是 a 的奇异值.[这里，冇意泛用丫一个记号： II . ir 通常表示范数 hi 的对 
偶 范数； 尽管还不知道 hi 是范数，不过将证明 tiMi 是范数，并且 a 明，当 II . ir 用对称度规 
范数定义时，它就是对偶范数 .] 我们已经证明这个函数 m n 是 M , 上的准范数，因为它是用 
利称度规 滴数 〆 （_) 定义的， 

现在计算 II _ |厂的对偶，根据 （5. 4. 12), I'.ll u 肯定是 M „.„ 上的 范数. 我们知道，矩阵 
36耐„,,„适合 j | B || D = 1 ，当且仅当 B 的奇异值分解是[其中，酉矩阵 
ew „, 2二 diagGj , …，〜）]且/([ £? ,，‘--，对于每个给定的矩阵 / IfM ,," ，有 
( II /\ [| ° ) D = max Kc[.A , BJ — max Re trAB r 

II B FJ -1 II li II D ■] 

= max{Re tr A ( V 2 tV ' )* : V 6 和 IV f M „ 是酉矩阵， 

2 二 diag(.s,, — ,j,), {L 

IK 

对于适合上述约束条件的每个对角矩阵 2, 我们可以利用 (7.4. I 4 )计算这个极大值，并且能在 
酉矩阵 V , W 的所有选择上达到极大值： 

( II A || D ) D = max{ ^]cr,(A) U I ： ff D ([ s , ,•••,.«,] T ) = l }. 

fn 是，因为所由定义 （ ni 2) 显然可知，这个最大值 m 好就是在点[^(泌，）...， 
A (/ U ] r 取值的 S _ D (_) 的对偶范数.然而，对偶定理 （5. 5. U ) 保证，范数的对偶的对偶是原范 
数，因而 

( 1| A H D ) l> =- ，…， tfJA )] 7 .) = ( A ),( iJA)]】）=li A || . 

于是，对 所冇力 ll -4 i | =(|| A ,|| c ) u . 它保证 HI 实际上是范数，因而它适合一.角不 
等式.这个结论也说明泛用这 t 记号是合理的，这是 因为， 由对偶定理可知，（||力||) 0 = 
(( II A I ! ,J ) U ) D = II A II D . 因此，用对称度规函数 〆 *(•)定义的 IM n 确实唁范数 H 的对偶 
范数相同. D 

c， 上的对称度规函数的一个熟知的重要例子是~范数族 （5. 2. 4) 


5401 


,… ， _r,J r ) 」II .r ||, = (2 I .rj")' \ l^p< 00. 
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当它应用于矩阵的奇异值时*正如定理 （7. 4. 24) 中所描述的，各种范数诱导了 M,„.„ 上的各 
种酉不变范数，称为 Schatten p 范數， p = 2 的情形是 FTobenius( Euclidean) 蒞数 


的极限情形是谱范数 
而户一1 的 情形是 迹范数 


l ; A |,, - [2 c7 ^ A) "]'"' 
i A ； 7 = max{tf, (A)) , 

lll - 4 l | l , 厂 


在例 ( 7 .4.S) 屮.当考虑用一个酉矩阵的纯量倍来逼近方阵的问题时自然要出现迹范数. 
C 上的另一类对称度规阐数族在（ 7 . 4. 44>中给出，它们也诱导出迹范数和谱范数._ 


7 .4.26例奇异值在推守 Wielandt 不等式屮起着重要作用，这个不等式给出了非奇异方阵关 
丁诺范数的条件数的儿何意义. 

设 A6M N 是非奇异矩阵，设 SpyVAeAt , 且用… 表示 A 的奇异值.正定矩 

阵乃的夺异值(按约定的递增顺序排列）设 . V CC" 是任意 -- 对标准 
正交向最，定义 0-[_r.y] M? ，且用 OCX 乃表示（:的特征值. r = 2 的 Poi_d 分 

离定理 (4. 3. 16) 说明 

A*(B) = al~t . 5；. A[ (C ) = 7( A,t* ： () — cl t» 6 = 1,2, 

或 


^ (?2 和 IT ^- ■ ] Sj Yi ( T ?. 

对实际应用来说，在这些不等式中，值得注意的关系是 

(fi < Yi < ?-! < di , (7. 4. 27) 

其中，如果 X 和3；是^?的相应于其特征值分别是 A 的最大和最小奇异值的平方的标准正交特 
矸向 M ， 则第一个和最后一个不等式是等式. 

经计算， 


! _ I By | ; _ J _ Cr" arK . y - B . y )- By | 2 

(/ Bx)(y' By) (jr- Bx hy' By) 2 - (j-* B.t ~ y-By 7 
_ 4detC 

~ ( T 77：) r - (,-* B . r - y ^ ( 7 . 4 . 2H) 

= --- - n - . -一 > — 

( + 72 )" — ( j * iij- ~ .y * By ) 2 (y, 十 y:. ’ 

其中等式成立当且仅当 I， >， etr 是标准 th 交 i &] 量 ru • &=〜• b v . 我们把这个不等式变成等 
价的不等式 


1 ， ' 母丨 :， 1 乜 ^ - -7M E _ (YJh-U 2 r , . 

U ^)( y - By ) ( r , i/i + yj " U/h + iJ . (7 - 4 - 29) 

(/.，^⑴中的上界是比值广/；^的单增函数 L 这可用当 f >0 时函数/(〖）= (/—])/(;十 1) 的导数 
为正的事实 来讪明 1根据 (7. 4. 27)，这个比值有上界44^因而 


! 1 : 〈 (<A/^-iv = / /— 1 

(j-'Hr>( 3 --Bv) \^/^ + l! ~ \T+i 


(7.4.30) 


m 
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其中，引进了正参数^以）=的/^ = |||4| | 1 | 八- 1 || 1 | 2 >1,它是 A 关于谱范数的条件数，如果 
«„ec" 分别是相应于特征值 d 和 d 的标准正交特征向量，乂如果八吃， y= 
( m .- mJ / v ^, 则 U，3*1 ■是标准 TE 交组 ， Bx = y- By=U+^)/ 2 , 且 _r* 如= (M —d )/2, 
这时 （7. 4. 30) 中取等号. 

用定义第一象限屮的角 I于是 

k 2 -1 _ col 2 ( 6 / 2 ) - 1 = ^osHe/ 2 )- sinHd / Z ) = „ 

； r h 1 — c.oxHd/2) + i — M7ce72T+sin 2 (9/2) — c ° 

并 fi(7.L 30) 可 ij 成形式 

£ 

g ―- ^ cos 2 fl. (7.4.31) 

如果我们注意到这个不等式的左边 关于: r 和: V 是零次齐次的，那么最后可以用两种等价的形式 
叙述 Wielandt 不等式： 



7.4.32 定理设垦具有谱条件数《的某个非夺异矩阵，且用 COt G/2)=« 定义第一象 
_ 限中的角 L 则 

| <Ar ,Ay) |< cos^ il Ar || ; , || Ay ||； (7. 4. 33) 

对每对正交向量 .i', „vec" 成立，其中 <«, 表示 Eudid 内积，而 1| « || 2 = (^ w )u 表 

示 Eurlid 范数.另外，存在一对标准正交向 M J', „vfC" 使 (7. 4. 33) 中的等式成 
7.4.34 定理设 SeJW„ 是具有特征值的某个正定矩阵.则 

I ， *B.y | 2 < (^^) 2 U*RrH^*B^> (7.4.35) 

对每对正交向量 j ', 成立.此外，存在一对标准 TF 交向量I, 3 1 6(："使得（7.1，35)中等 

式成立. 

证明： 在 （7.4.31) 中作代换5 =斤/\便得到不等式 （7. 4. 33), 在 （7. 4. 30) 中作代换 0 f = 
并且考虑到每个正定矩阵 S 具有形 SB=A+A， 其中 A€M„ 为某个非奇异矩阵，由此 
得到不等式 （？. 4. 35); 可以取 A = B 1= . 我们已经知道 （7. 4. 30) 中的等式对一对标准正交向量 
成立. □ 

练习证明， （ 7 . 4 .般的 Caiichy-Schwarx 不等式的改进，它是丨，| = 

I <C>., Ct ) 丨 < P Cr |Ui 〔> L 其屮不过 Cauchy-Schwarz 不等式适应于所有向量 
偶 X， ju 而 (7. 4. 邪）只 适用于 正交向僦偶.加果 A,=A„， 会出现什么情况？ 

Wielanch 不等式的形式( 7 .4 3 3 )直接导出谱条件数的一个有用的几何解释.如果^ 

C" 是任意 -- 对标准正交向量，则不等式 

Trarrr^;^ ca ^ (7 - 4 - 36) 

左边是非零向 MAj •与 Ajr 间的较小的 Euclid 角的通常余弦.这个界说明， A-1 ■与 A；y 间的较小 
角至多是 i?=e(A)， 其中沢 A) 用 cot [汛 A>/2]= 以 A) 来定义.因为在这个界中可以取等式，所 
以已经证实，当 -r 和 .v 取遍所有可能的标准正交向量时， 6KA) 可几何地解释为 A；r 与 Ay 间的 
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最小角.这一论点已在 (5.S) 节和 （fi.3) 节讨论过. _ 

众所周知的 Kantorovich 不等式容易从 Wkhmdt 不等式推出.对任意 ieC B , 定义 

,y = II C7.4, 37) 

并 F1 注意到: rj = 0. 经计算， 

By = i| _r || jj- -■ (x* B _l x)Rr, 

By - || x IU- U f D 

y'By =~ W B ~' j ：)( y ' Bx ). r 

因为 R, 因而 B 1 都是正定矩阵，我们一定有，因而 y’ar = T*%<0 - 把不等式 
(7. 1.31) 写成形式 

I J ^ 'By r < cof , 2 0(. T ' B , r )( y a By ). 

然后特意选择适合 （7. 4. 37) 的一对 _r, ^代人上式便得 
I By I 1 ^ ( cos 2 «(^* ilr )( j -' 

在 x'ii. y <0 或， B>，= 0 两种可能情形，这蕴涵，对任意 .r6C", 有 

By =—L iU IN U' •B-^>U.*Rr)] < (cosYK^Rr )!：， 

或 B.r)(x' B l .r) < || x ||J. (7.4.38) 

应指出的是，如果 j = w , + w „ 是石的相应于它的最小特征值和最大特征值的单位正交特征向 M 
的和，则 （7. 4.38) 是等式.这就诱导出 Kantorovich 不等式的两种形式，它们与 WMandt 不等 
式的两种形式相对应. 


7,4.39 定理 设 A6M, 是具冇谱条件数《的某个非奇异矩阵，且用 cot(W2)= K 定义第一象 
限的角^则 

II 丄 . II 泛 sin^ || Ar !| z || (A* [| 2 (7. 4. 40) 

对所有 a 七 C" 成立.此外，存在单位向量 x 使 <7. 4. 40) 为等式. 


7.4.41 定理 是具有特征值的某个正定矩阵.则 

ll - ril ^ ) ： (x' Bs)U' B V ) (7.4.42) 

对所有 _ rec " 成立.此外，存在单位向量 i 使 (7 .彳 .42) 为等式. 

证明： 将月二 A + A 代人 （7. 4. 38)，并且能想到 


sinM 二 l - fOS 2 fl = 1- (^ y - 


4 AAiA „ 

oT + a 7^ 


便可从 (7. 4. 38) 推出这两个结论 .（7. 4. 40) 和 （ 7 . 4. 42) 中可能取等式的事实可以从 (4. 4. 38) 中 
取等式的情形推出. 口 


(443 


7 . 4 .43例 有时可能要证明某些对所有酉不变范数都成立的关于矩阵的范数不等式，证明的 
关键在于认识到用 

^ max{ | 〜 |4■…+|、 | :1 < k < … < H n\ , k = 1, … "i. 


(7. 4. 4.1) 
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定义的 C 上的特殊对称度规函数 &(「 A , …， x ,,] T ) 的基本作用.当把它应用于矩阵的奇异值 
时，正如定理 (7.4. 24) 中所描述的，这个特殊的对称度规函数族 诱守出 M „,„ 上的两不变范数 
族，称之为樊畿 A 范教. 6=1的情形是谱范数，而〃:>的情形是迹范数. 


7.4.45 定理设 . v =[. v ,] eC " 是给定的向量，则对 C " 上的所冇对称度 
规函数 {；(*) 成立.当且仅当价对6 = 1，2,…，》 成立； 其中# 〆 ■)是 （7.4.44) 中 
所定义的特殊对称度规函数. 

证明： W 为毎个 ☆(•) 是对称度规函数，条件的必要性是 M 然的.为了证明充分性，假定 
St U ) s £ 办 （ 30 对 6 二 1 , 2,…，《成立，且设私（_)是给定的对称度规函数.由于对称度规函数 
是其自变 M 的分讀的置换不变函数 （？. 4. 22). 为方便起见，不失一般性，我们可以假定和1 
的分暈的绝对值都排成递增顺序： 




|.ri |<：! j- 2 <U'„ I, I % i <1 力 >■„ I. 

于是心 （ WsShCv ) 对所有 4 二1， 2, …，7!成立的假定等价于《个不等式的组 

I J -,： I < I , y . U 

I -r„ 1 | + 1 .<■„ I ( I .y„ t I 十 I ：*■’„ I , 

i (7.4. 46) 


I -fa H - hi .i-„ I<| y 2 H - H 氕 I ， 

I -r, I +1 If … +1l《| )■] |“ I 为 I I … +| y„ \. ( * ) 

这些不等认与关于优化概念定义的不等忒组 U . 3. 24) 间的类似之处不仅仅是表面的. 

如果这些不等式中的最后一个+等式 （*) 不是等式，通过缩小分 My 的绝对值来修改_1, 
冇到或者 ( a ) 不等式 （* ) 是等式 ， 或者 (W I . v , I 缩小成零.如果 ( W 出现在 (《) 之前，对下一个 
分量力重复这个步骤，如此做下去直到 (《) 出现.其结果将产生一个修正向 ay —[/,], 使得 
对 i - = l ， … ， 《有 i / I ^ I .V, I * 对所有是 =] ， … ， n ， 有； ， 且 （*) 巾等式成 
立.由于绝对范数也是申调范数 （5. 5. 10)，我们有右（/)<片0).因此，如果我们能证明 
gU ) 在对适合不等式组 （7. 4. 46)( 其中的 U )是等式）的任意 T , 成立，那么可以得 

知，对适合一般的（7.4.46)的任意心 ^6 C " 也成立. 

假定 （*) 为等式的 (7. 4. 45) 成立就是假定向 M — | i | =[__ U I 16 R " 优化向量一 I j I 
=[-I y I ] eira 3.24>, 时在这种情形，我们知道存在双随机矩阵 S € M „ 使得 一 I T | 二 
5(— | y | ) 或丨 』 I =S : y | (4. 3.33). W 每个双随机矩阵是有限多个置换矩阵的凸组合 
(8.7.1)，我们可以把 S 写成 + …十叫 Pw 其中， a ,^ Q , a ] + …十 0v = l , 且每个尸 
e 紙 是置换矩阵.这时，有 


只 ( 丄）二 {；.( I .r | ) 

.V H 

= I y I) = ^'( 1 ,v I )< I j I) = XI 山 gC I ) I > = 只 （I y I) 

i^j i=] j =I 


二 H<y^ 

这是因为 #(*) 是绝对向量范数，且 #•) 是其自变 M 的分量的置换不变函数. □ 

定理的意义在于，为 r 使 m „,.„ 上的每个酉不变范数 ii . ii 有|| a || < || ^ || ,必须时且只须 




正定矩阵 31? 


这个等式对樊畿 A 范数成立，々 = 1，2，…， minim, n ). 


7.4.47 推论设九起分别具有竒异值 為0 和《5】（川> …. 

>0的某两个矩阵，其中 gsmidm ， 要使 II A || <； || B |1 对上的每个酉不变范数|卜| 
成立，其充分条件是对所有7 = 1, 2,…， （/有 


而其必要充分条件是 




C7. 4. 48) 


a , (AJ 

^,(A) + ff! (y\) CB) +tr : (fi). 


: (7. 4. 49) 

A (A) 4-<r ；： (-4) 十 … ■+■ <t,(/I) < cn (B) 十 … +^(B). 

证明： 所需要的关键论断是， M …上的 酉不变范数是其自变 虽的奇 异值的对称度规函数 
<7-4.24). (7. 扣)的充分性只要求对称度规函数是单调范数的事实 （5. 5. 10)，而关于不等式 
组 （ 7 . 1. «) 的更为明确的论断正是前一个定理的内容. 口 

为 r 应用推论 （7, 4. 17) 证明范 数+等 式， 重述 下面的事实常常是有用的：诸 Hermit e 矩阵 
之和的有序特征值组成的向 M 优化各矩阵的有序特征值组成的向量之和. 


7 . 4 ‘50引理设 A，BGAi 是具有有序持征值 A …⑴的 

Hermhe 矩阵，乂设 AA.4 … (A — 川表小 A—B 的有序特征值.则向量 
A(/\) -A(B) - [A,(A) A,(B)_] 

优化向最； 1(4 — B ) = U ,(.4 — 即 

min{ 2U, (A.) - A, (B)」:l < A … ^X,(A ~B) 

}= 、 i=l 

对々 = 1，2，…， n 成立，其中等式对 & = „ 成立. 

证明：定理 （4. 3. 27) 说明，由 A — 的特征值组成的向量 AC4) 二义（（,4_衫）+乃） 
= U,“AU B)] 优化向 i|A(A —B ) .卜； — 扪+以抝]，它等价于向量 AW) — 
A(B) 优化向鬚: A(A —fi). □ 

以 （7. 4. 47) 中的条件及上述引理为丁_具，常常可以把关于范数或谱范数的逼近定理或不等 
式推广到整个酉不变范数类. 

例如， （7.4. 15) 说明，如果 A , HeM _ 足分别具有有序奇异 值 51( 片）>-..> 5 /4)> 0 和 
(扪>0的某两个矩阵，且尸!!!;!^™， 《}, 则 

表示这个下界的另一种方式是 

M - fill ； II 2(/1) -2( B ) II ,, 

其中， A ^ V ,2'( AW ； 和是奇异值分解，及^和 2( B ) 的“对角线，，上的相应 
奇异值按从最大到最小的顺序排列.这种不等式的另一个例子是 （ 7 . 3 . S(a)) , 它是关于谱范数 
的. a 4 .15) 推广到所有酉不变范数就是取这种形式. 
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7.4.51 定理设 .4. ^^时„„是具有竒#值分解,4—込2(』）^7和召=\^1：(扪》7的某两个 
矩阵，其中 ， w v ^ eA ^. w ,， w : eM „ 是丙矩阵，而: sm ) 和 2( s ) 的“对角元”都按递减 
顺疗排列，则 ll A - iM > || 1 AA 、 2'( B ) || 对 M ,,,,,. .1: 的每个酉不变范数 I ! _ I 成立. 

证明： 设 (； = nii n <:w. mK 利用 （ 7. 3. 7) 把/ \ 的夺好值 
〜 （ A ) Xe - u , ( A ) ^ 0 

*5 Hcrmiic 矩阵 


前 y 个卄正特征值对应起来，叉的 OT +?! 个有序特征值是 

<7 i ( A ) <- (72 ( A ) < … ct , ( A > < 0 =…，0 < <7,( A ) < … 〜 （ A ) , 

对 A 和;\一6也可以作类似的对应. A 与的有序特征值的差是丄[^(八）一的(^)]，…， 
士 UU ) — A (⑴ J 以及 （I ^ i-n | 项） 0. 进然如何排出这个序列的顺序一般是不清楚的，位 
是，按照这个序列的顺序，</ t * 小的元是 { — UU 〕 一 I ), 把引理 （7. 4. 50) 应用于 A , 

448) 和便使我们确信 

k 4 

S —1( A — B) < mitij 1 <A) —a. t (^) I :1 < … <_ i k ( n' ， 

.] ；-1 ' 

对6=1，…， q 蚊 、 它等价于 

k k 

^a,(A B) y ： max{ 2 I 1 ( ⑴ .ff, (B) | : 1 ( i] <-: … < / s < «} 

■ -1 ；] ； ' ' 

对 々一】•■*■， g 成立.因为 U 6,( A )- a ,( B ) ' f 是 Z ( A )—2( B ) 的竒异值的集合，推论 

(7. i . 47) 保证 I A — 川 I > || ^( A )-2( B ) i | 对任何酉不变范数 IM 成立. □ 

7.4.52 例 定现 （7 ..t 51) 的一个推论是，对于在例 （7.4. 丨）屮所 f 虑的关丁 Froluiniiis 范数求 
某个矩阵 A 6 M ,, 的（在最小一乘意义下的）最佳秩 A 逼近问题作推广_如果 I . |!是西不变范数， 
又如果 S 6 JW „ 有秩々，则 cr , CT *- [ ( fi ) = …二〜（3). 丁」是， 

II A B !| > il 2(, A ) - KB ) |, 

=11 diag(cf| (/l) -- (j| (B), *■■ .a t (A) ._ 〜（_H) .心㈠ （A) ，…， j,, (A)) || 

> I ! diag (0, …， 0,(7*,., ( A ) ，…， (；„ (,-U ) || , 

其中，我们用到 mft 矩阵的酉不变范数是单阔范数的生劣，这是因为它是诸对角元的对称度 
规函数.另外，当 K = Vi ： W ^ 时可能取等式，其中 ， A = V 2( A ) VT 是 A 的奇异值分解，此 
K=(liaf；|>i(A)， …， cr t (A), 0, •■■, 0J. 

因此.对任意， AtM „ 和秩为6的任意 A |„, 义予任意两不变范数有下界 
I ： ^ U I. 為 diag(0 .… ， O，。*^ (A) ,… ， (j„(j4>) || 

^ a„(A) || diag(0, ■** ,0,1 ， … ， 1) '| 

(最 后…个 表示式的对角线上有 A 项零），其中，第…个不等式可以是等式， 而第 二个不等式一 
般不取等式.第二个不等式（如果 A 是非奇异矩阵.莰不等式完全可以从对称度规函数的单调 
忭推出，而如粜 A 是奇异矩阵，则结论是明显的）有以下优点：它对范数的依赖关 系只是 A 的 
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衲数而不是 A 的函数.特别是，这说明，对仟意非奇异矩阵 AGM,, 和任意酉不变范数||_||有 
tt 大下界 

|| A-H |1 >■ ^(/0 |1 diag(0,-,0,l) || . (7.4. 5^) 网 

它对 A 与任意 Si 择矩阵 /i 问的距离成立：即/I到奇蚌矩阵所组成的闭集的最小距离（X十两不 
变范数 il. I I diagCO. ■■■. 0, 1) || . 

7.4.54 例我们可以利用对称度规函数的忡质给出 M„ 上的两不变范数迪矩阵范数的简妒特 
tf. 如果 Hi 是 M„ 卜.的丙不变矩阵范数，则从推论 (5.6.35) 得知， 

成立.利用定理 （5. (;•!)) 和 M,, 上的毎个两不变范数是 tl 伴范数的事实（见习题 2), 用论断 
[ £ 7 1 (/\吓=^八?^|/1’/\|011；.4」一||.4 | ,|_ : 也可以良接证明上述结论.另-方面，设：叫|_ 

是使 |A 对所冇 A6M„ 都成立的 JW, 上的两不变范数，乂设 ff 是由 || ，||i 秀导的 C" 上的 

对称度规函数.利用 7. 3节习题18中给出的类似于 Weyl 不等式的关于奇异值的乘法不等式以 
及 A； 是单閊范数的事实便可推出 

|AB ；[- gk ( AB )， 〜 （ AB )， …， 〜（ AB )) 

-二 A (A )^(cr L IB ) ，[^ (B)，••. 

: B !|| < ' .4 || I /? j. 

因此， M , 上的商不变范教 j 是矩阵范数，当且仅当 ; U ll .；^ M )=^4 4 对所有 AeM ,, 成 
立.特別玷，所有樊畿*范数， ^-1. fl . 以及所有 Sdmt ™ 々范数， /->!. L 它们分 

别是由 （7. 4.4) 中的对称度规函数及 （5. 2.4) 诱导的]是矩阵范数.这个特征的另一个推论是， 

M,」 上的百不变矩阵范数所组成的集合是凸集， M„ I .的所 有矩阵范数所组成的集合不是凸集 
[参看 （5. 6) 节习题 9]. 

习题 


1.设.46从,,,,,的秩1>0.假定求一个秩为 k 、< k 的矩阵 A ] t M ,„,„ 要求能按 
数最佧逼近九说明这可以按下述方式进行： 

设 V 2 W ‘是 A 的奇异值分解.设工除了仅取1，…， a 而其所余下,， - h 个“对角， • 

元为零以外，兄与2是相同的.于是•有所要求的性质. 提示： 利用 （7. 4. hi ) .注 
意到 （73. 5 2)证明了所给逼近不仅关丁 ■ Fmbenms 范数是“最佳”的，而且. X ；于所有酉不变范数 
也是“最佳”的. 

M „ 1:的范数称为自伴范數，是指 || A || - || A ' || 糾每个 A e M „ 成立.试用定理 
( ns 4 ) 证明. m „ 上的每个酉不变抱数是自伴范数.试给一个是自伴范数血木是酉不变范数 \ m \ 
的例子. 

3- 试用定理 （7. 1.10) 和例 4.(;) 的方法来确定.用-个具有标准正交行的矩阵 kgm … 

的纯 M 倍对 .个给 定矩阵(其中的最佳 ft 小一乘逼近.提示：证明 t 这样的矩 
阵 V .定有形式 Y = V 7) IV , 其中 和 IVeM , 是丙矩阵， D=Li OjeM ,,,,,, 7 eM ,„ ，而 

O&M . 极小化 || A — #11〗的问题与极小化 II A J ：；-- (Re tr AY' flm 是相同的.如果 
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是 A 的奇异值分解，说明这个极小化问题变为求 

mS x Rt - tr \ swrrv -. w ^ m „ 和 vt 是酉矩阵}. 

然后利用定理 （ 7. 4. in ) 解这个如冏例 （ 7, 4. 13 ) 中的问题.说明这种情形 K 的误差值与例 
(7. 4. 6) 有相同的形式. 

4. 考虑对角矩阵 A , BeM „, 证明所有可能的排列 r 町以出现在 (?.■!. 11) 屮. 

5. 芩虑 （7.4. 7) 中定义的函数 M / U . 证明 

对所有 A € M „ 成立.且这个界是可达到的.试用定义竹接址明《(/1)是 M ,, 上的向量范数，并 
且说明为什么 WA ) 实际上是 M ,, 上的矩阵范数. 提示： 参看例 （7 .彳 .54). 

S . 证明，如果 A € M „ 是非奇异矩阵 ， A !,, IjA 1 1 2 是 A 关于谱范数的条件数， 
则最大奇异值和最小奇异值之比.这如何同估计 k ( A )> | AJA ,, | 作比较？ 

7‘ 证明 Kantorovich 不等式 (7. 4 . 42>中的常量是 A ! 和; L 的儿何平均值与 A , 和/ 1 „的算术平 
均值之比的平方. 

8. 设是非奇异 Hermite 矩阵.试用 Katuorovich 不等式 （7. 4. 40 ) 证明 

iA-VHk _ dJb^. = l(^) t 

W_ II -i II 2 i<S\0„ 2 ' (I„ (T| / 

其中是 A 的*异值.证明，和〜分别是/\的渚特征值的最大绝对值和最小绝 
对值，并且证明 


其中^是/\的谱条件数.给出一个向量 J '使上述极大值可 达到. 利用谱条件数以及它与 t 面所 
定义的极大值的关系，说明为什么有 



直接证明这个+等式.提示：证明对于 _r>l，/(■£) 二 .r 一 0 + ( l/.r).j/2 是增函数. 

9 - 设 Ai ， A z ， …，是《个给定的 fF _ 实数.试用 Kantorovich 不等式 （7. 4. 42) 证明，如果 
a ..-， 〜是非负的，且其和为1,则 

( Sa)(S 

(=1 1 1 ^ ! 4 八 tUBJtA【 [LLn 

瓜证明（厲于 Greub 和 KheinhoUlt 的） Kantorovich 不等式 （7.4. 42) 的下述 推广： 设 B，C 
是交换的正定矩阵，分別有特征值和则 
(， BC：yr ^ 认 a ?" (， B , x)U ， ⑸ 

^ A„/i „)~ 

对所有 j：ec ■都成立. 提示： 因为对某个丙矩阵 t/eAi 有 b =[ 从 u ' 和，先用>,= 
av 写所要求的不等式，然后用写不等式.于是代 B^AiW 1 应用 （7.4.41) U J 证 
明所要求的不等式成立 （R 可取等式），并且对于指标的某个选择有形如 
A] _ 

(Ai/Jy ■ VX . ftk ) 2 
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的常数.证明这个形式的 M 小常数肖厂 -1 和时出现.但是， 这® 后的推广不等式不可能 
取等号. 

11. 简化1^加01'0^七'1 1 不等式（7.4.42),证明，若是正定矩阵，则对所有』 _6 C " 有 

C ' t .' B^)W B -' x ) ^ |； '| J . 

更一般地. 若 fi 6 M „ 是正定矩阵，证明，则对所有 . r , >_6 C " 有 

(. t " B l y ) ^ ( J -' y )\ 

其屮等式对 \ v 成 i . 由此得出对所有有 

( j-.-rY sSG - UCVn - V ) < L(Al ^ ,,)/2 ^( x - j -)- J . 

n 

提示： 如果 A,>0, 证明 

卜 12 ^^-,)(^)| < (2 a , I i 2 )(S 4^)- 

然后记 fi ^ UAU ' . 

1 2. 设是正定钔阵， jec 是任一非枣向量，且定义 

f ( B , y ) = min j ^ r^yr :丄 6 C " ， j -" v ^ 0 |. 

证明 /( B , W 是有意义的，然后利用习题 11 讪明 / Ui ， y ) = l / y-H ' y . 证明 / 具有超加性性 
质，即对所有 C " 和所有正定矩阵.4, 有 

f(A-^B,y) > JXA,y) f f(B,y) 

观在 a,y—f,, C 是第； 个标准单位基向量，然后推出 Bergstrom 不等式 
deiLA + B) 、 del A , det B ., 

dcTiKTK) ^ diTA ： 4 dtTtf/ ; = 1 ，，'" 

对任何正定矩阵 A ， B & M ,, 成立，其中 A , eAi ,-, 表示划去/1的第 / 行和第， 列得 到的 _4 的主 
子矩阵，灶的意义类似.这种接近于 Bergstrom 不等式的方法是有着广泛用途的所谓拟线性 
化方 法的- 个应用 实例； 拟线性化是把一个所考虑的 M 的非线性函数表小成另一个函数的约束 
极值，而这个新函数线性地（或许只是加性地）依赖于所考虑的量.在 （7.1.24) 中的关键步骤 
(证明用奇#值的对称度规函数定义的 JW 上的准范数实际是.-个范数）是用 （5. 4. 12) 屮的拟 
线性化完成的. 

13. 对 f 任一复数 h 不等式 I s - Re * | | z-.r | 对任何实数： r 成立. 这个不等式到方 

阵的看似合理的推广是 

| 卜 '. y(.4H- A* )||< |1 A-W II 

对所有 Hermite 矩阵 H 6 M ,, 成立‘证明，这个不等式对所有酉不变范数 | H 以及更一般地对 
所有肖伴范数成立.由此得出， （关于 11.11 ) 从一个给定矩阵 AtM „ 到由 jW n 中的 Hermite 矩 
阵组成的闭集的距离是 + IL4-AMI . 提示 ： A —+ (A + /V ) = + (A—/T) h j(H~A ) , 


\M 
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[fil || A- ^ (.A+A' ) I 在+ \\ A — H :| + 士 ll !i . 

14. 对仟意复数 z ， 有不等式 I Rc ； < I H ■ 址明它的明显推广 II (A + A * )/2 || < I ! A || 
对所有 Ae M „ 和所冇酉不变（甚至自伴 ） 范数 IH 成 i . 

15. 设 A & M „ 是给定的，…在 A ,, 是皆 M + /V ) 的有序特征值，乂设是 A 
的有序舒异值.说明为什么不等式 

A„ t. 1 | y A + A" J I cj| (/I), k — I,*- - 

可以看作关于复数的不等式 R P I z I 的一个推广.这个不等式是说， A 的第6个最大奇异 

值大于或等十 ) 的第 A 个最大特征值.提示：若 单位向最，则 

■y.V* (A +A' ).v 二 Re A ). 在 || A_v II?. 

用 （: 《urant Fischer 定理 （■!. 2. 11 ) 表示及卜，，然 G 用这个不等式和 < 7. 3. 10 > 得到, 

16- 设 A 6 M ,, 是给定的，乂设 ||， i | 是 M „ h 的一个两不变范数.利用 （7. 4. 5]) 证明， 

I 八 U !| > ,| 2( A ) 」||对任一 丙矩阵 L / eHi 成立， ft 这个不等式可取等戎.由此得出 
： l ^ A )-/ l | 是（关下- || *|| )从4到由 M „ 中的两矩阵组成的紧集的距离. 

17. 设 A€At 有奇#值分解 A = V 2(/\) W ，乂设||.!|是财„上的酉不变范数.证明 

||2：( A ) —HI si ^ ||2( A ) || 

对任何西矩阵 [ JtM ,, 成立 • 提示： 址明，在任 …酉矩 阵的任一奇兄值分解屮有 2(U) = f ，丁- 
是从 （7. .1. 51) 宵接推下界成立.关于上界，利用 （7.3) 节】6题中类似 亍 Wcyl 的加法特征值 
不等式的奇异值不等 式证明 ffilj 1 (.A + (-[ J ))^ CTl ( A)i aA ~ U ). 然后用 （7. 4.48). 

18. 试以例 （7‘ 4 . 53> 中关十卄旮异矩阵 /\ 的不等式为指南，求 ||A — iM 的最大下界，其 
中， Ae / Vt 是给定的秩 々，矩 阵， B 6 M ,, 是任意秩矩阵.而 H | 是酉不变范数. 

进一步阅读定理 （ 7 . 4 .2 i) m = n 的情形的最初原型属于 Vcm Neumann ; 可参看 （ S . 4) 节 
引用的文章- Wielandt 和 Kantorovich 不等式取 Q [Hou M ], 并且作 f 改编 ， [Hou 64」还有 
许多原始资料，钉关的推广以及其他资料可参看 A . Clausing ， ‘‘ Kantorovirh-Type 
Inequalities ,'' Amer . Math. Monthly 89(1982). 314-320. 习题] 2 中接近于 Bergstrom 不等 
式的方法取它用-大章(还有大量的参考资料>专门论述由正定矩阵引起的诸不 等式； 
并且对拟线性化方法也有讨论，还给 ff _, 了许多例于.关于对所有两不变范数都成立的诸不等式 
的其他资料可参# U Mirsky , 11 Symmetric Gauge Functions and Unit«nly Invariant Norms ," 
Q 仙 rt . Math, (hford 11(2)( 1960), 50-59 以及 K . Fan nnd A . J . Hoffman , “Some 

Metric Inequalities in the Space of Matrices ," Prut -. Amer. Math. Stic. 6(1955), 丄 11-116. 
例如，这些结果如何应用丁统计学以及有关统计学文献的其他资料可参看 C . K . Rao : 

Matrix Approximations and Reduction of Dimensionality in Multivariate Statistical Analysis,” 
Multivarmt^ Analyse - V , Prccredin S s of the Fifth International Symposium on MLiltivariate 
Analysis, P. R. KrishnaiaK, Nfirth-Holland, Amsterdam. 1980, pp. 1-22. 
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7.5 Schur 乘积定理 

-- 个特别简单（又形式 A 然 ） 的矩 阵“乘 法”是按对应分量相乘. 

■7.5.1 定义如果 AsO / leJVt .,, 和 ii — 给定的矩阵.则 A 和 n 的 Hdamard 乘 
积是矩阵 a 。 

常常称 Hadamard 乘积为 Schur 乘枳.像矩阵加法一样. Hadamard 乘法是可交换的，闵 
而它比普通矩阵乘法要简单得多. 

Iladaman] 乘积自然可以从儿种不同的观点产生出来.例如， /(W 和以3)是周期为 2ir 的 
连续周期函数，义如果 


« ( = [V w ./((mw 和 b t - 「 V\(f?>cy ， 
*- o , 士: u 十2,….则卷积 


h ( d ) = [ J /(0-/) w c ?) d / 

有三角矩 


- j : V ， W ) d (9， 

它适合悄等式6 = 0 ，士丨，土 2,….于是，/1(£0的二角矩的 Toeplhz 矩阵是 /((?) 和 
^0)的=角矩的 Tueplitz 矩阵的 Hadamard 乘积： 

)』，」=[〜，」。!_卜 J . 

如果. /( W 和片 (⑴ 都是非负实馆闲数，则卷积 ⑴ 也是非负实值蚋数.因此，如 （7,0.5) 中所证 
明的那样，矩阵 [ a , J , (_&,：) 以及 [< W ] 都是半正定矩阵.这是 Srhw 乘积定理的一个实例， 
诙定理 是说： 两个半正定矩阵的 Hadamard 乘积是半正定矩阵. 

又如，考虑积分算子 


K (/) = J K (丄''『)/( _ v ) cb 、 

其屮，核 K (』_，. y ) 是有限区间 [ a ， tAX \ a , 幻上的连续函数 ， a fe . C [ u , 6], 如果我们冇第 
一1核 HG .，_ v ), 则可以考虑（逐点）乘积核 LO ，， y )- K (. r , 3 *) 和相关联的积分 

算子 

■ [(/)=[ h(.r- ： V)/(.V)d ： v' = J K (J ： .y)n(j-,y}f(y)dy. 

线性映射 /— K (/') S 然是矩阵向量乘法的极限（把积分看作存限 Ri emann 和的 逼近） ，并且 
积分算子的许多性质可以通过对矩阵的已知结果取适当的极限导出.从这个观点出发，积分核 
的（逐点）乘积9■'出 个 积分算子，它是类似于矩阵的 Hadamard 乘枳的自然的连续 形式. 

如果积分核 KU ', )_) 有以下性质， 

j I K (.r,y )f(x) f(y)iixdy ^ 0 

对所冇 6] 成、乂，则称 K(>r ， .v) 为半正定核，个经典结果 （ Mercer 定埋）是说，如果 
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K ( x . )0 是冇限区问 U ， W 上的 连续半正定核，则存作 组 正实数 U ,} (称为“特征值”）和一组 
连续函数称为“特征函数”)使得在 U , *] XU ，/;] 上冇 

KU , y ) = 2 仏？ (）) ■ 

[456] 且该级数绝对一致收敛. 

如果 KU, W 和 HU', : y) 是同一个有限 KNl ^ 6] 上的连续半止定核，则 Htz , .v) 在 
U, 幻X [“，幻上也有绝別 -- 致收敛的表达式 

Hu , y ) = v 

,-1 ^ 

其中， 所有的 A >0. 根据相应级数的直接乘法.（逐 点） 乘积核 Uli, y ) = K { x , y ) 

在 ^ JX [^ 幻 h 有表达式 

; ( f >3 ，) V 必彳⑴化 

它也绝对一致收敛.于是 

|J^.(.r v v)/(^>/X3')dxdj' - 2 U sM』.) 也 (’)/Dclr| _ > 0, 

丙而『丄 r ， 也是半正定的 • 这是 Sdmr 乘积定理的另一个实例. 

练习证明-两个 Hermite 矩阵的 Hadamard 乘积总是 Hertnite 矩阵，但是，两个 
Hamb 矩阵的普通矩阵乘积是 Hamite 矩阵，当 ft 仅当它们是可交换的. 

^ 考察矩阵 a =[; ;]_=[;;]._， A ， B 和 A 。 B 是半正定矩阵， 而普 通 

的矩阵乘积 A B 不是半正定矩阵. fii 是可以证明的特征值是正的. 

在这里引进 Hadamanl 乘积的主要理由是，（不同于普通矩阵乘积)它使由诸半正定矩阵组 
成的锥不变，它还给出了 半正定 矩阵和非免实数问的另一种类似.我们从一个具有独立意义的 
论断开姶. 

任意矩阵可以表示成-些秩〗矩阵的和，其中被加矩阵的个数等于诙矩阵的秩，而对于半 
正定矩阵，被加矩阵也可以选为半正定矩阵. 

7. S . 2定理如果 AeM „ 是秩 A 半正定矩阵，則 A 可写成形式 
A = vi + …+ v t vt , 

其中，每个 uee ， jilt -,, 竹>是非零向量的正交组. 

证明： 利用谱定理将 a 写成 A=rwu ■，且设 r 是 LJ 的第；列的; I ”倍. □ 

我们的主要结果常常称为 Sc liar 乘积定理 . 

7. S .3 定理如果 A , 是半正定矩阵，则 A 。 B 也是半正定矩阵.此外，如果4和丹 

都是 IF _ 定矩阵，则 .4 。 B 也是正定矩阵. 

证明：利用 （7. 5, 2) 记4 =讣_< + … + W * E ^ 和召二叫叫， + „ KJ ,: ，其屮々 = rank .4 H . 

™ = rankB . 注意到 
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A 。 2 ， 

w_l 

其中因为 A 。 3是 （秩 1) 半止定矩阵之和.所以 A =■ B 也是半正定矩阵. 

如果 A 和乃都 是正定矩阵，则 6 = w = ». 且向量组和都是 C n 的正交基.尚若 
是奇异矩阵，则存在某个作零向使得 ( A 。 B ). r =0, 因而 

X * ( A 。月).!" = * (“為’)丄二史 I I 2 = 0. 

另一方面，每一项必须分别为零，因而_ ' 

I s' tt v [ "° -- I J：' (v, = !£', ) I ' — I (T 。从 )* | ； - 0 

对所有 〖和 J _ 成立.这说明，对毎个；，向量 T 。 V ,正交于所有向量％,处，叫，因此， 
- r 。及 =() 对所有2,…，"成立.特别是，这蕴涵 tV>r = 0 对所有 ； =1，…成立 . 因为 
这意味着 . r 与基的所有元素正交，所以-定有 .r = 0. 由此得出 A ■ fi — 定是非奇异矩阵 . U 
练习设 A , De _ M ,. 试用 (7. 「;. 3 )的证法证明，当 A 和 fi 是半正定矩阵时，总有 nmkA 。 
B<(rank AMrank B ). 特別是证明，如果 (rank AKrank B )< n . 则 A 。 B —定是奇异矩阵. 

练习 证明，当/V和 B 是 H erm he 矩阵阳不一定是半正定矩阵时， .b 述练习的论断仍然 
成立. 

练习 考察矩阵 /\=匕□和 B= £ =， 说明■即使 A 和 B 都有正的秩， rank A。S 
也可能是零. 

练习 证明，如果 A 是正定 矩阵而 B 是负定矩阵，则4»3是负定矩阵. 

7-5.4 推论 (Fej er 定理）设 A 二- [aJeJVi, 则 A 是半正定矩阵当且仅当 

☆A >。 

对所有半正定矩阵 B — 成立 . 1 

证明：假定 A 和 B 是半 IF— 定矩阵， R. 设 _rec" 是所有分错都等 T_ 1的向量.十是 
是半正定矩阵，而且2七\正好是 I, (A □ Bh.， 它肯定是非负的.反过来，如果当 B 是半正 
定矩阵时有此时对任意给定的向量 xer 令石=[\]=[1,4]. T ■是 B 是肀正定 
矩阵，且 


~ a,,x „r s — x* Ar 0, 

因为 ^ ec " 是任意的，由此得出 a 是肀 正定矩阵. 口 

7 .5 .S 应用设 DCR " 是冇界开集.由 

u '$， u) t^ + 十 cLr)u (7 - 5 - 6) 

给出的 CHD ) 上的二阶线性微分算子；：称为在 I )中是椭圆型的，是指对所 有的 : re D , 矩阵 
是正定矩阵.假定存在某个 „ eC ’ ; （ D )， 它在 D 的闭包上连续 II 在 D 中适合方 


_ 






程 /.« 一 0. 关丁喊数《在0中的呙部极大和局部极小.我们能说些什么？假定是关 干!/ 
的局部极小值点.于是对所行/=：!. 2.….《有 


并且: Hessian 矩阵 



- 0, 



在点^是 IF 定的. W 此，在点： v 有 


汴 II . 山 t ' ekr ® a (7.5.4) m #， 含有」 阶导数的和必须是非负的，因而项< (. V )«( 必须是非 
l _ F 的.特别是， 如桌七 )<0.则不可能有 „(_ y )<0. 同理可证，如杲乂>，）<0, < v ) 不可能 
在相对极大值内点为止.这些简单的结论就是下述兎翌原理的要点. 


7.5.7 弱极小原理 设用 （7.5. S ) 定义的算 f 为 D 中的椭岡型算子， II 假定在卩中 〆 .!.)^! 
如果此 C : ( D ) 在 D 中适合 L a =0, 则《不能有负的相对极小值内点，成若不4能有正的相对 
极大伉点.此外，如果《在〗_> 的闭包 1:连纹 n . rnD 的边痄上非负，则《在0中必定处处非负. 

从极小原埋可以推出偏微分方程的一个基本的唯一性 定理： 

7 - 5-8 FejiT 唯一性定理假定用 （7. 5. 61定义的算子 LjE 椭阏塑的，设在 D 中 t 并且 

考虑下述边值 M 题： 

D 中， Lu ^ f . /是己知 函数； 

{\-^0 \：, u = g , 尺是 C 知函数； 
k /) 中，《 一. 次连续 可微； 

在 D 的闭包 t :« 连续. 

则这个问题至多存办一个解. 

证明：假如“ i 和《」是这个问题的两个解，则函数是同一类型问题的一个解， 
不过爲冇零边值条什且在 D + LkO . 由弱极小原理可知，在_0中^必须非负.把同样的论 
证 ttiT V ，得知 w 在 1) 中也必须非正，因而在 D 中 □ 
练习说明弱极小 股理和 Fwi ■啡 性 定; ® 如何应坩于 D [ R " 屮的偏微分方稈 W-;u = 
o . 其中 AS | R 实参数. 

Schu ! ■乘积定理的最后.个推论是容易址明的.如果 = [ 心] tJW „ 是半正定矩阵，那么 
A = .4 = j ;] 也是半正定矩阵.由归纳法可知，对所有4 = 1, 2,…，所有正整数次 Hadanard 
幂 [4 " I 是半正定矩阵.因为半止定矩阵的仟意非负线性组合是半正定矩阵 （7. 1. 3)，这蕴涵， 
只要所為 a ,^- 0 , 

u , J + CJ , A + 心.4 。 A I …十 U „, A = L ( J | 汁屮〜十化 iif , i — h 

— Lp(u ,,)] 

就姑半正定矩阵；十… + a „,. r ™ 是非负系数多项式.更一般地，如果 
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f{z) = 

a 

是解析函数，其中所有且收敛半径 K > U , 则经简单的极限证法可证，只要所有 | \ I 
< R , 就是半正定矩阵.或许最简单的例+是 / u )= 〆 ， 其*级数对所有 z&c 

都收敛，它的系数是心=1/々！ >0. 根据这番证明，只要 A = 是半正定矩阵， ] 

就是半正定矩阵.这个结果还可以改进； A 的较弱条件足以保证以 A 的分量为指数的矩阵是 
丰正定的. ECHJJ . 

7. S .9 推论设 A = 是半止定矩阵.则 

< a ) 对所有々 = 1，2，…，矩阵 [4 J 是半正定 矩阵. 

( b ) 如果 /( s )= 咖+ …是 具有非负系数的解析函数，且收敛半径 Ji >0, 则当 
所有 | j </( 时，矩阵 [/ UJ ] 是半正定矩阵. 

习题 

1‘证明，如果 ff ( AKA 的 Hermite 部分)是正定矩阵，且 B 是正定矩阵，则是 
正定矩阵. 

2 - 如果 A = [ a ] 是半正定矩阵，证明矩阵 Lis 厂]也是半正定矩阵. 提示： 考虑 A 。 A . 

3. 如果 A = [ u , j 6 Ai 是半正定矩阵，证明对所有 AGR , 矩阵[/_，1是半正定的. _ 

4. 如果 A = IX ：| eM „ 是半正定矩阵，则正赘数次 Hadamard 幂矩阵 A u > 和 Hadatnard 绝 
对值平方矩阵 A 。 A 恒为半正定矩阵.但是，关于 Hadamard 绝对值矩阵丨 A 丨 =[ | % | ]， 

其结果又如何呢？ U ) 假定 A & JVi „ 是正定矩阵.对”=1, 2, 3,利用行列式准则 <7. 2. 5) 直接 
证明丨 A I 是正定矩阵.试用取极限的办法对半正定矩阵 4( 仅当„ = 1，2, 3时）得到相应的 
结果. （ b ) 利用 /( dcosG ) 是正定函数的事实[或把 cos (: r ) 写成 cos (. r ) = Ce " +<; 11 )/2 然后计 
算二次型]证明，对 Um m …，匚 R 的所有选择和所有 《 — 1，2，…，矩阵 A = [ cos (_ r , 

〜弋）]是半正定矩阵. （ C ) 设 k = 4, 且设 . n =0，. r ! =7 rAl , - t 3 = t ：/2, 和 . Ti = 3 tt /4. 在这种情 
形，直接计算 （ b ) 中的（一定是半正定的）矩阵 A ， 并且得出它是 Tceniu 矩阵.计算丨 A |和 
det | A | ,且证明丨 A I 不可能是半正定矩阵. 

5. 考虑习题4中的矩阵 I /\ | . 证明 ， fie | A | 。 | A j 是半正定矩阵，而它的非负 
" Hadamard 方根”小是半正定矩阵.将这与普通方根 S 1 2 的情形作一比较. 

6. 考虑用 


10 3 



L 1 9 4 10」 

给出的矩阵 AGM ,. 证明 A 是半正定矩阵但 | A 丨不是半正定矩阵. 

1 -设 K (工， 是有限区间 [a， 幻上的连续积分核.证明 KU，J) 是半正定核当且仅当对 
点集 6] 的所有选择和所有《= 〗 ， 2 ，…，矩阵 [ ku , ，是半正定矩阵. 
提示： 为了证明矩阵条件是充分的，考虑对积分的 Riemann 和逼近 ' 
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| J K " ( j '. jO / m / bOd . rd )' = X (. r , , x ,) f ( jc , )/(. r , 

为了 W 明矩阵条件是必要的，考虑函数 


國 


fix) = -O 

1 ■ 1 

其屮氏（: T ) 是“近似在函数' 它是连续的，和非负的，在区间[一 £ , E ] 外恒为零， R 适合 
| (? r (. i ) d.c = 1, 

然后让 e —0. : 

S- 试用习题？和士+^乘积定理证明半正定积分核的 （逐点） 乘积是半正定的.这个证明方 
法是比较基本的，它不需要积分方程理&中的 M ercer 定理. 

9. 证明，函数吒 〔 XR ) 是正定函数 [(7. 1) 界习题 8 」 当且仅当 K(.t, — j ) 是半正 

定积分核. 

10. 证明，两个正定函数 AG ), A (. t ) 的积表） U ) 是正定函数. 

11. 说明为什么所有函数 

(a) si -^^ = T>0, 



( c ) 



TT ? d; 


以及它们彼此间 的所有 乘积都是正定函数. 

12. 利用 U ( r ) 给出 （7. 2) 节习题12屮的矩阵是正定矩阵的另一个证明. 

13. 如果 .4=[ U , J 6 M „ 是半正定矩阵，证明矩阵 [心 / U + j )] 也是半正定矩阵.提示： 
(7. 1) 节习题 17. 

14. 设 ACiVi 是半正定 矩阵. 证明，■适合当且仅当 Ar =0. 如果 A 仅仅 
是 Hermhe 矩阵，用例子说明可能有 . n 二0而•乒 0. 提示： 将 A 写成 A = UA (7“， 于是 
- T ' A . r -0 当 U 仅当 2 A , U 1 2 =0.其中 z = V ^. 

15. ( 顶点在原点0的）凸锥是这样一个凸集 S , 使得射线 { A - r : A >0} CS 对所有 j . eS 都成 

_ 立.凸锥 S ' 的一条射线彳 h : 是一条极射线，是指若对于 0< a < l 和> 有 = 

(1 一 ah 仅当 j 和 z 都在该射线上，等价地，凸锥的一条射线是一条极射线，是指把它从该锥 
中删掉后所得到的锥还是凸的.证明， M „ 中由半正定矩阵组成的凸锥中的射线 UA : A > 0 } 是 
一条极射线当 li 仅当 A 的秩为 1 . 于是定理 （ 7 . 5 . 2 ) 是说，毎一个半正定矩阵是位于极射线上 
的诸矩阵的一个凸组合. 提示： （ a ) 如果 ^ 6 (：" 是非零的，且 = a A + (l — a ) B 对某个 £<6 
( 0 ， 1 ) 以 及丰正 定矩阵 A , 成立，设 U .]， …， J ：„} 6 C " 是一个适合 _r ' _ r * = 0 ( 其中 

2 ,…，《>的标准正 交组. 于是 0 = _ r / A ri = 4B ： r f ， 因而根据习题 14 每个心在 A 和 B 的零 
空间中.由此得出，力和 B 的秩都是 1 ，并且各自都是的一个正纯量倍数. （ b ) 如果 At 
M „ 是半正定的，曰.其秩々> 2 ,利用定理 （ 7 . 5 . 2HdA = B + C ，， 其中只=即*, v 相 ， ra nk C > 
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1，且 Oy = 0. 由此得出， C 不是 ii 的一个纯 M 倍数，因而 A 不在极射线上. 

7.6 相合： 乘积和同时对角化 


与正实数的乘法不同，普通的矩阵乘法不总保持正定性.两个 Hermite 矩阵的乘积甚至可 
以不是 Hermite 矩阵 （ R 有当它们可交换时，乘积才是 Hermite 矩阵），乘积诱导的二次型可 
以不1非 负的. 我们特别把这一节的重点放在正定矩阵上；关于 Hwmitc 矩阵的更一般的结果 
见 （4. 5) 节. 

7.6.1 例设4=[__^ 3和 j ]， A 和 B 是正矩定阵.但 AB =[ — ; 不是对 

称审阵，^甚至连正定矩阵都不是. 

但是，正定矩阵的普通乘积至少还保留了一点正件.我们的讨论要说明某些涉及矩阵的和 
与积的有用技巧. 

7.6.2 定义我们知道，两个矩阵 A , 1 T 相合，是指存在非奇异矩阵 C 6 A 1 使得 S = C * AC . 

汴意，和相似一样， * 相合是等价关系.有时在复的情形采用术语共扼相合，以便把它和实 
相合区别开来. 

7-6.3 定理正定矩阵 AeM „4 Hennite 矩阵 B 6 M „ 的乘积是可对角化矩阵，它的所有特征 
值都是实数.矩阵 Afi 与 C 有相同数 g 的正特征值，负特征值和零特征值.此外，任意只具有 
实特征值的可对角化矩阵是-个正定矩阵与 -- 个 Hermite 矩阵的乘积. 

证明： 对于前一部分，注意到于是后一个矩阵相似于 AB , 因 
而与它恰好有相同的特征 ffi . 凶为是 Hcrmite 矩阵，所以矩阵相合于 B . 因此， 
根据性定理 (4. 5.8), B 的特征值与的，因而与 A 月 的特征值有相同的符 
号集.此外， W 为 A 1 : 是 Hemiite 矩阵，它可对角化，因而 AS 也一定可对 角化. 关于 
后-个论断 * 假定是可对角化矩阵， .H. 只有实特 征值： C=SDS 其中 D 是实对角 
矩阵，则 C=S(S'S*_ 】）DS J =(.SS* )(.S 11 DS- 1 )=AB, 其中 A = SS. 是正定矩阵而 S; 
S ^ as - 1 是 Hemute 矩阵. □ 

两个矩阵可经相似同时对角化是不常有的，需要较强的附加条件：交换性.但是，两个 
Hermite 矩阵可经共同的'相合同时对角化所需要的假设条件就很弱.经■相合同时对角化对应 
于用诸变量的一个线性变换把两个 Hermhc 二次型变换成诸平方项的线性 组合. 下面的结果是 
经 典的； 关于综合的结果见 (4.5.15). 

7 . 6 . 4 定理设 A , 是两个 Hermite 矩阵， R 假定存在 A 和 B 的一个实线性组合可以 

是正定矩阵，则存在非奇异矩阵 C 6 M „ 使得 C ' AC 和都是对角矩阵. 

证明： 假定对某个《， /96 R ， P 二 0^4+ jSB 是正定矩阵. tr 和;3中至少有一个必定非零，所 
以可以假定 卢#0. 但是，因为 ' P — a A )， 如果能证明 A 和 P 可给. 相合同时对对角化， 
则可以得出， A 和也可经*相合同时对角化.由（？.2.7)可知， J 3 ■.相合于单位矩阵，即存在 
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某个非奇异矩阵使得 C 7 PC , =7. 因为 C / AC , 是 Hermhe 矩阵，所以存在酉矩阵 U 
使得 L /' CMCJ / O 是对角矩阵，令 C 」 C , t /， 则有 C * K：=f 和 C "/ IC = D ， 并且 C ， B (;= 
_ 戸 】（ f 一 aD ) 是对角矩阵. □ 

这个结果最常见的应用是针对力学中的经典情形的，其中，两个实对称二次型是给定的 a 
有一个是正定的. 

7.6.5 推论 如果 /\6 M „ 是正定矩阵，且 BeMJiHmmte 矩阵，则存在非奇异矩阵 C 6 M , , 
使得 dC 是对矩阵且 C ‘ AC -/. 

练习 试求 诸变量 的一个变换使得两个二次型 5^-2 xj +/ 和 , r 2 十/ —/都是平方项 
的加权和. 

对于一个是正定矩阵，另一个是（复）对称矩阵的矩阵偶，也有类似的结果.这个结果也可 
以归并到 (4. 5. 15> 屮. 

7.6.6 定理 如果 AeM 是正定矩阵，且 E 6 M ,, 是复对称矩阵，则存在一个非奇异矩阵 C 使 
得 CMC 和 CMC 都是对角矩阵. 

证明： 我们选取非奇异矩阵 C ,6 M N 使得于是 CrBQ 是对称矩阵，因而根据 
Takagi 分解 U . 4 . 4) ， 存在酉矩阵 (7 使得 L / VcTBCdU - D , 其中 D 是对角矩阵.于是也有 
U -(； rAC ,[；=/ ( 这样，可以取 (：:=(:, U . n 

这个结果可应用于复变函数论；关于单叶函数的 Grmisky 不等式是由正定 Hermite 矩阵 
和复对称矩阵所诱导的二次型之间的不等式. 

下面的结果是（ 7 . 6. 5) 的直接应用. 

7.6. 7 定理 函数 /( A ) = log det A 是中正定 Hermite 矩阵组成的凸集上的严格凹函数. 
证明： 对任意两个给定的正定矩阵 A , B 6 M ,,, 必须证明， 

/C(i4 + (1 — ff)B) >a/{A) + (1 — a)/(B) <7. 6. 8) 

对所有《£(0, 1) 成立，而其中等式成立当且仅当 A = B . 利用（7.6.5)写出力= 00*和1!= 
_ OIC ' 其中，是某个非奇异矩阵 ， A = diaga " …， AJ , 且所有 A ,>0_ 于是， 

/(aA 十 （1 - a)B)= fiClal + (1 -a)A]C* ) ^ /(0C* ) 十 /(aJ + (1 — a )A) 

= /(A ) 十 /( a / + (l - a)A), 

且 

«/( A ) 十 （1 —«)/(£})= a /(/\) 十 (1 - a )/( ac -) 

— af(.A) + (1 —«)[/( fl ；') 十 /(_ A )] 

= af(A) - {- (1 — a ) f(A) + Cl — a) A) 

=/(A) + (l- a )/CA). 

因此只需证明，对所有 a e (0, 1)，/( a / 十 （1— a ) d )>( l — a )/(/ l ) 刘具有正別角元的任意对角 
矩阵 d 成立.但这容易从对数函数本身的严格凹性推出，因为 

f(al + (1 — «) yl )= log ] J [ a + (1 — a ) A ,] = 2 log [ tt + (1 — a ) A ,] 

1-1 1 
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^ 1 + (1 —tif)log Aj 


= (1 — a) 1 = ( 丄 —cs ： )log]jA J 

j-l r-3 

=(1 — a)log det y\ = (1 - a)/(A). 

这个不等式屮的等式成立，当且仅当每个人=1，而这能成立当且仅当4=7且£ = 0(^ =A. 

□ 

定理 （7. 6. 7) 常常采用下述形式，它是对不等式 （7. 8) 取幂得到的，它对正定矩阵的凸组 

合是正定矩阵，因而一定是非奇异矩阵的事实给出 了数童 表示. 

7. 6.9 推论设 A ，_ B€M„ 是正定矩阵.且设 0< a <l .则 

del[aA 十 （1 — a )fi] > [det A]"[det B] 1- ", 

其中等式成立当且仅当 A = B. 

习題 

1- 假定 A6M„ 适合 A+=S_MS, 其巾 S6M„ 是正定矩阵.证明 A 可对角化且 A 的所有 
特征值都是实数. 提示： 考虑 /LS = SA '. 证明 AS 是 Hermite 矩阵，然后利用 （7. 6.3). 

2- 证明 /(A) = LrA 1 是关于 TF_ 定矩阵的严格凸函数. 提示： （7.6.7) 的证明. 

3. 如果八6抑„是半正定矩阵，如何推广 （7. 6. 3)? 证明， AS 的特征值还是实数， fl. AB 
的正特征值和负特征值不会比 B 的多，不过它可能有更多的零特征值. 

4. 如果不是 Hermite 矩阵， （7. 6. 3) 可以推广到什么程度？ 

5- 试用例子说明，能两个 Hermhe 矩阵可经相合同时对角化，但它们不满足 （7. 6. 4) 的 
假设条件. 

6. 设 A, BeM: 是给定的 Hermite 矩阵.就 A 和 B 的特征值而论， Af {的两个特征值的 
实部的所有可能符号是什么？你能把它推广到吗？ 

?.设 A， 是 Hermito 矩阵，吐 A 是正定矩阵.试用(？.6.5)证明， A + B 是正定矩 
阵，当且仅当的每个特征值大于 一1. 提示 ： A + 十 A — 

5. 设是 Hermite 矩阵，将 H 写成十出，其中 A, BeM„(RJ . 验证 A 是对 
称矩阵而 S 是斜对称 矩阵， 因而 B 的特征值是纯虚的，且成共轭对出现.试证 H 是正定矩阵 
当且仅当 A 是正定矩阵且 M 的每个特征值大子 一1. 提示：利用 X* = 对所有 

成立的事实.利用习题 7. 如果 a 是正定矩阵，证明，如果 a 是^-:^的特征值，则一 
A 亦是它的特征值.由此得出， H 是正定矩阵，当且仅当 A 是正定矩阵且的每个特征 
值位于区间（-1， 1) 内， Jf EUA j 的特征值成对彳一 A, A 丨出现.由此得出 (KdetiA—jK 
1，因而 delB<detA， 这是 H. P_ Robertson 的不等式.现在记 十 ; B = J + M — ] E) , 

然后证明，如果 H 是正定 矩阵，则 det H=det Adeia+iA _l B) 且 0<det(J + !_A _1 B)C1 .由 
此得出，如果 H 是正定矩阵，则 d e tH<de t /U 这是 0. T auss ky 的不等式. 

9. 由定理 (4. 1.7) 可知，矩阵是两个 Hermite 矩阵的乘积，当且仅当 A 相似于实 
矩阵‘试用( 7 . 6. 3) 证明，是两个正定的 Hermite 矩阵的乘积，当且仅当 A 可对角化且 
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[468] 只有正特征值. 提示： 关于逆命题，考虑 A V/IS '. 

10. 如果 A , B £ M „ 是正定矩阵，则我们知道，乘积是正定矩阵当且仅当 AB 垦 
HermUe 矩阵.证明相同的结论对/个正定矩阵的乘积也 成立； 也就是说，如果 A , B ， C'e 
M ,, 是正定矩阵，则乘积 S = AB (7 是正定矩阵， 当且仅 当它是 Hermite 矩阵. 提示： 记 S = 
( AB ) C = EC , 根据习题9,其中£’有《个芘特征值.利用 （7. S .:» 证明，如果 S 是士1^心矩 
阵，则 EsSC:— 1 与 S 有相同数目的正特征值. 

11. 对习题 10 巾的结果的 y 述另一个证明作详细的论述：设 S ( a ) s [( l -- a ) C + a A ] fit :， 
其中如果 S ⑴是 H erm it e 矩阵，又因为 S (0) CSC 肖然是 Hermke 矩阵，所以所 
有 S ( a ) 都是 Hermite 矩阵.证明所有 S ( a ) 都是非竒异的， W 为 （ 1 -dC + uA 是非奇异的. 
S ( a ) 的诸特征值连续地依赖^当 a = 0 时所有特征值是正的，因为所有 S («) 是非奇异的，故 
它无零特征值.由此得 ;li S ( l ) 的所有特征值是正的. 

进一 步阅读关于取 A 各种正定类的矩阵所作乘积的其他结果，以及关于多个正定矩阵之 
积的较早结果，其有关的资料可参看 C. S. Ballantine and C'. R. Johnson* 1 Accretive Matrix 
Products，”Lh. Muitilin . Alg . 3(1975), 169-185. 

7.7 半正定次序关系 

因为 HemiUe 矩阵是实数的推广，而正定矩阵是正实数的推广，与然耍问，在 ㈠ ^^如矩 
阵类中是否有不等式关系或(偏)序关系的适当概念. 

7 . 7 . 1定义设 A , Be At 是 Hermite 矩阵.如果 A —B 是半正定矩阵，我们就用表 
示，类似地表示 A — B 是正定 矩阵. 

绦习证明上述的不等概念与矩阵的相等概念是 -- ■致的，即证明和蕴涵 A 

= B‘ 

练习 证明，关系 > 是传递的和自反的，何它不是 全序； 即存在 Herm 如 矩阵儿 D € M „ 
_ 便得 A >£! 和 B > A 都不成立.这样的关系称为偏序. 

实线性空间上的偏序常常定义如下：确定某个特殊的闭凸锥，并托说一个元素大于或等于 
另一个元素，是指它们的差位于这个特殊的锥中.在这种情形， nXri Hermite 矩阵的集合是 
实线性空间，而半正定矩阵的集合是闭凸锥.这 M 然是 R 自身为实线性空间而非负实数集为 
闭凸锥这一熟知情形的推广.不过在 R 上给出的是“晋通”的（全)序（而不仅仅是偏序). 

矩阵间的各种其他的“不等”概念 〈其 中最值得注意的是按照分量确定实矩阵的 大小） 可以用 
类似的方法来定义：把矩阵的一个锥看作非负实数的推广，并且说 / T 大于或等于” B , 是指它 
们的差 A — B 位于这个锥中，一般，这样-些不同的“不等”概念可以通过上下文来区别，不过 
它们的效用取决于与实数集的类似推广到什么程度以及这个“不等”概念与其他不等关系 （例如 
特征值、行列式等之间的不等关系）有多么密切的关系. 

注意， A 是 fJH 定矩阵，当且仅当而乂是正定矩阵，气丑仅当 A >0, 其中0是与 
A 同阶的零矩阵. 

练习用例子说明半正定偏序关系在下述情形与实数的全序关系不同：如果且 A 不 
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等于队则得不出4>坟 

下面，说明半正定次序关系的某些性质，其中每一个可以看作实数的普通次序关系的推 
广.其类似程度一般是很强的. 

7.7. 2论断 如果 A ， 是 Hemiite 矩阵，则 

A > B 蕴涵: T 1 /\T > : T /ir 

对所有如果且有秩 ffl , 则还有 
A > B 蕴涵 T ' AT > 3'- RT . 

证明： 如果 A — 是半正定矩阵，则: (.4 — B )>^0 对所有 jeer 成立. 

于是， ( T * AT - T - 抓)』=(1^0 1 (1-£)(^為0对所有^^<：" 成立，而这表不 T * AT - 
广 Br 是 f -正 定矩阵.因此 rA 7> r ' B 7'. 注意，这推广了 （7. i . s ), 而其证明本质上是相 
同的. □ 

练习 验证上述第一个论断以完成证明. 

7 .7‘ 3 定理 设 A , 是 Hermite 矩阵，乂假定力是正定矩阵且只是半的定矩阵.则 

当且仅当 〆 BA ')^1, 而 A > i 5 当且仅当 〆 R 4—)<]. 

证明： 根据( 7 . 6 . 5) ，可以求出非奇异矩阵 C 6 M ,, 便得 AH ' 和,其屮 D = 
diagCJ ,, <) 是对角矩阵.于是 A > S 当 ft 仅当 C|j — i >]00, 这义当 II .仅当怂 

对所有 hi , 2，…成立.但是因为 iM 1 -CDC C l C'=CDC 所以似 1 的特征值正 
好是…， AL 根据 (7. 6, 3) 它们都是非员的]，且所有必当 F 1. 仅当 〆 / M - ygl .仔 
细分析刚用过的那些不等式便可得出后一个论断. □ 

7.7.4 推论 如果 A ， 是止定矩阵，则 
U ) 当且仅当 B >>,A ! ； 

< b ) 如果 A > B , 则 del B a u , A^tr B ； 

( C > 更般地，如果 d 和 B 的各相应特征值按 N --( 递增或递减）顺序排列，则1(/\)> 
AAG ) 对所有々 = 1, 2,…， H 成立. 

证明： 我们知道当且仅当 〆 但是 〆 BA . 1 ) 二 4), 而 （7. 7.3) 说明 
P (A 当且仅当 iT 1 如果则 〆 又由 （7.6.3) 可知 t / M 、 1 的 

所有特征值是非负的，所以得知它们必定位 TK 间 （0， 1] 内.另 一为 面，它们的乘积至多为 
i ，所以 det ( i 3 A _ 3 )<1，闶而 （ift A > det fi . 在 （ 7. 7. 3) 的证明中，已知 A = CT ‘和 B = 
CD 「* ，其中 C =[ c 「,] eM ,， D "" diagt^A , d z , d „ ) e M ,, 且对所 有；. =1, 2, …， 
0<4/,< l . 不难算出. 

trA = trO ；. ~ ^\ c „ I 3 , 

t '!= I 

II . 


XtB= tr CLX：' = tr DC'C- U, l : 


画 
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\ c l; \ 2 = tr A . 

I 卜厂 j 

最耵…个沦断 (它蕴涵行列式不等式和迹不等式，对此，我们已经给出了两个无关的讪明）可 ii 
_ 接从 Hermite 矩阵的有序特征值的 Courant-Fischer 变分特征推出，并 U 包括在推论 （4. 3. 3 ) 
中. □ 

练习如果力>七>0.证明 det A>det 召和 tr A>lr 

当把关于分块矩阵的逆的形式 (0.7. 3) 限制到}^^^ £ 矩阵的情形时，便得 出下述 有用的 
公式： 

「A BV 1 _ r ( A-BC l B - )-' A-'BCB* A r 

Lb* C 」 — Ub' A H B —C) tA 1 (C-B-A-'B) 1 J' ( 7 ‘ 7 ‘ 3) 

在这个公式巾，假定 A 和 C 是方阵且需求逆的矩阵是非奇异的. 

如果矩阵是正定矩阵，贝 ij[^ 存在且为正定矩阵.于是从 （7.7.5) 和 

(7. L2) 推出 （A—HTW 厂 1 和 A —BC 3■是正定矩阵.类似地， C—iT A—M，A 和 C 是正 
定矩阵.因此，如果分块 Hermite 矩阵是正定的，则有 

A > 0, C'> 0, BC 和 C;；> A -1 B. 

7 . 7 .6 定理假定一个 Herrmte 矩阵块分成 

[I ， 

其中力和 （’是 方阵.这个矩阵是正定的当 Li 仅当 A 是正定矩阵且此外，这个条 
ft 等价于一 定有〆 iT A Mr 'XL 

证明： 这两个条件的必要性 Q 在上面做了 论述. 关于充分性，假定 A 是 TF 定矩阵且 C> 
B'A ' B , %\ X=-A l B , 算出 

「7 o]「A BIT/ x-]^ rA 0 1 

Lx* /JLfJ* cJLo / J~ Lo C-B'A- i BJ ， 

因为右边是正定矩阵，所以 



的正定性可从所给出的相合及 （7. L S) 或 （7. 7 . 2) 推出.把 （7. 7. 3) 应用于不等式 OB ' A 
[4721 便得到后一个论断. 口 

「 A B~| 

练习如果 cy 0t 证明士 t C > det 1 召和 det A> det ^ 

时，这说明什么？证明，如果 B 是方阵，则 I d C LB I、 

练习假定 AfH ， 和乂假定 A 和 C 都是正定矩阵.证明 
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当且 仅韦 〆 B ‘ A - ' BC -' Xl . 

(7.7. 6) 中的分块正定矩阵与出现在复变函数和调和分析中的某些双线性不等式有关，这 
些不等式都具有正定偏序的某些性质. 

7.7.7 定理 设和是正定矩阵， fl 设则下列条件等价： 

( a ) ( j -* I 彳 2 对所有 xtc " 和所有 3 ， ec M 成立； 

(b) jc' Ax^y'Cy^2 \I 对所有 , r € C ™ 和所有 成立； 

( cV ( B * A 'BC ' XI ； 



证明： 我们来证明， （ a ) 蕴涵 （ b ), ( b ) 蕴涵 （ C ), ( c ) 蕴涵 U ); 已经知道 （ c ) 和 （ d ) 是等价 
的-如果 U ) 成立，则由算术一几何平均值不等式有 

yCjf-Ar + ^' Cy ) ^ QyP x * % | ， 

所以 （ b ) 成立.如果假定 （ b ) 成立，则 

， k ) 十 （ C 1 、）‘ （04)22 | _ r *% I ，因而对每个 i 6 C " 和 
每个 y 6 C "' 有 


. r - 2 - + y' y'^. 2 \ ( A " 1 a . r ) ' \ = Z\ I -' A ~ , ：! ^y |. 

如果在这个不等式中令: l 7 BC - ] \ y , 便得 

y-C'^B'A-'BC 1 ， ! y~i~y-y'^2\ y'B'A 'BCr^yl. 

因为矩阵 c _' 2 / rA _ 12 H ： "是半正定的，这等价于对所有有 

如果选取 j 为（: _ I z fT A WC-w 的特征 向量， 这个不等式说明，（一定非负）的相应特征值不 
大于1,于是得知谱 f •径至多是〗；即 1,1 B'A 'BC h ' 2 )^ pi . B ' A .'BC -1 ), 因而 (c) 成 
立.最后，如果 (c) 成立，则对任意 tCC " 和任意 >£(："' 有 

|，’（n p< II III \\A-^BC 

= ( ， J)(n'4 'BC-^yy^tr-x)(y' y), 

其中 IU Lsu 、) 1 £ 是 Euclid 范数.如果我们现在作代换和 y — C 1/z > 则对所有 
■ rtC " 和所有 ^ ec ", 有 

I i'By I 2 < (j-'ArK^' Cy). □ 

对于由 （7. 7. 5) 产生的另一种不等式，我们考虑能应用于正定矩阵的两种可能运算：基于 
指定的指标集选定主？矩阵与求矩阵的逆.我们知道这两种运算保持正定性，但是按两种可能 
的顺序实施这两运箅的结果之间存在什么关系呢？研究结果表明，这两种运算“除了相差一个 
不等关系以外是可交换的”. 

7.7.8 定理假定是正定矩阵，且设 SC {1， 2,…，幻是一个指标集，则 
P '(S) > [PCS)]"' , 


画 
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其中，这 t 不等式左边是划去 P 1 的标号为 S 的诸行和诸列后所确定的 P 1 的主子矩阵，而冇 
边是 P 的相应主子矩阵的逆. 

证明： 因为正定矩阵的集合在置换相合下封闭，我们可以假定 



及厂 ( A '):- 九 干是广 UShM — 仪 ： W 且 [ P ( S )] ^/ r 1 . 由于 00( 这是因为 

0)，所以冇 SCMiT >0和 

A > A - BC ^ B ' > 0. 

于是所断言的不等式可由 （7.7. 4 a ) 推出. 口 

定理 （7 . 7. 8) 可以解释为 "一 个正定矩阵的主子矩阵的逆小于或等于该矩阵的逆的相应主子 

矩阵 

(7. 7. S ) 的一个应用是从矩阵的 Kronecker 乘积中特姝选择一个主子矩阵来产生其 
SU ] Haci«tmrd 乘积.如果 A, B^M„, 乂如果 S ={1, n+Z, 2 ?f +3, 3«+4, « z } , 则 

-(.40 BKS ). 若 A 和 B 可逆，则可逆且因此，如果4和 £( 
是正定矩阵且把 （7. 7.8) 用于 P = . A ® B , m A ~' ^ B 1 = ( A -'( g ) iJ -' HS ) = ( A ® B )- | ( S )> 
HAmUS )] —】. 如果取这说明 A L A 。 A ) ' 但是，如果取 

r ^ A 1 , 这便说明.当 A 是 』 F . 定矩阵时 * -4" 1 » A >{.4 » 

这后一个不等式说明 ， A 1 。,4优于它自 d 的逆‘关于 4-1 。/\，这指的是什么？如果 C : 
是正定矩阵， ^.C=UAV , A - diag(AM - , A „), 其中所有 A , >0，则 CM ;- 1 当且仅当; l , > 
1,因而 o / kf - 1 . 我们把这些结论总结为 

7.7.9 定理 设 A , B 6 M ,, 是正定矩阵 ，则 » 

( a ) A 1 - B >(A - B) '； 

( b ) A _ 1 。 A ~ l XA 。 70 叫； 

(dA — 1 。 A>I>(A~ l ^ A)" 1 . 

因为 A l A = I, 所以的前一部分说明 A ] ] A ; 即在这种情形. Hrfamanl 乘法 

优于普通乘法. 

习题 

h 一般，设九是 Hcrmite 矩阵 ， fl A>H, 证明，如果；10<久；；< — <人„是 A 的 
有序特征值，且…是 B 的有序特 征值， 则 A , , 2,但是用例子 
说明逆命题不总是成立的. 

2. 如果 A " A ” fl " R 2 6 R 都是 Hermite 矩阵，证明，如果 A , >氏，且则 

^1 + A z >Bi +B Z . 

3. 设 A, S ， C6M„ 是 Hermite 矩阵；假定 和 t:>0. 证明 A 。 - C. 

4. S A , B, C, 是 Hermite 矩阵，丨1_假定/\>£(>0和00>0.利用前一个习 

题证明 A □ C>B » D >0. 

5 . 如果 A ， 足使得的 Hermite 矩阵，又如果 _ /匚 {1， 2，…， d 是任意指标 



集. 证明 ACP-JKJ). 

6. 说明 （7. 7. 6) 推广了 u = 2 时的 （7. 2. 5). 

7-如果 C&M, ， （？. 7. S) 说的是什么？如 何为一 个正定矩阵增添…行和一列且仍保持正 
定性？ 

S- 证明， （7.7.8) 的不等式是严格的，当 .11 .仅当 P(S. S') 有满行秩，而当 P(S, S') = 0 
时怜好等式成立.这里， P(S, S') 是从 P 中划夫标号为 .S 的诸行和标号为 S' 的诸列后柑到的 
P 的子矩阵. 提示： 证明 nmkrp —i(S) —r)(S 厂 F(S, S'). 

9 - 如果是 Hennhe 矩阵，证明 I > A 当且仅当 A 的所有特征值小于或等于 1. 

10- 试用 （ 7 . 7 . 7) 给出（ 7 _ 彳）节习题 】 1 的另一个解法 . 提示：证明，若则 



11. 考虑力 = 0 时的（ 7.7.7). 证明下列条件等价： 

A^)(y' Ay}^ ! Jr'By I s 对所有 x, y^C" 成立； 

(b) x'A.r t- y 1 Ay>j \ ,r'By \ 2 对所 有，， x^C 1 成立； 

(c) plB'A~ ] BA MCI; 

(d) x- 对所有 xec- 成立 . 

12 . 证明，如果 AfM,, 是可逆对称矩阵，则 A A 的所有行和等于 1. 提示： 考察 A — 1 
各元的代数余子式 . 这样，如果 A 是实正定矩阵，证明，即使 A_ ] = A>I, 也不会有 A 1 
>J. 

13. 如果 表示 A 的 HadamarcU 次幂，乂如果 AeAi 是正定矩阵，证明 
M UI ) 1 对所冇 A = ]， 2,…成立. 

进一 步阅读关 f (7. 7.7) 的背景材料以及其他资料可参看 C. FitzGerald and R. Horn, 
“On the Structure of Hermitian-Symmetric Inequalities," J. London Math. Sor. 15(2) 
(1997), 419-430. 与 （ 7.7.8) ，（ 7. 7. 9 ) 有关的其他资料也可参看 C . Johnson, 11 Partitioned 
and Hadatnard Product Matrix Inequalities, f, J. Research NBS 83(1978) ， 585-591. 


7-8 关于正定矩阵的不等式 


"F 面，耍讨论这样 一 些不等式，它们所渉及的量_ .个或多个正定矩阵相关联.这些不等 
式与 —L 一节所介绍的不等式是有区別的，尽 管关于 前者的一些例子与关于后者的一些例子常常 
是有联系的.例如，蕴涵 detASidet S. 正定矩阵有一些涉及行列式，特征值和其他 
曈的不等式.在这一节，我们名察某#不等式’它们不- 定来自 矩阵不等式. 

关于正定矩阵的基本行列式不等式是 Hadamard 不等式，炸多其他的不等式用不同的方式 
推 r 了这一结果. 

7 . 8 . ] 定理 （H‘mard 不等式）如果 A = UJ t M,, 是半正定矩阵，则 
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此外，如果 A 是正定矩阵，则等式成立当且仅当 A 是对角矩阵. 

证明： 如果 .4 是竒异矩阵，就没有什么可证的，因此假定 A 是非奇异矩阵且它的所有 ^ 
乒 0. 定义义三心 1 "，且设 t ^ diagW 】， 心，…， <)■ 因为 detDAZXl 当且仅当 det A < u „ 
所以只要假定 A 的每个对角元等于1就可以了.如果 A , ，…，夂是 <4的（必定为正 
的)特征值，则有 

detA = f [ A , < (7§ A ') = (X = 1 

这个不等式可从关于非负实数的 i 术几何 f 均值不等式推出.算术一几何平均值不等式中等 
式成立当且仅当所有 A , = l , 但是，因为 A 是 Hermite 矩阵，因而可对角化，所以，这种情况 
能出现，当且仅当义=〖.因此，当4是正定矩阵时，在原不等式中等式成立当且仅当 A 是对 
角矩阵. 口 

关于一般方阵的另一个行列式不等式等价于 （7.8. 1), 它也叫做 Hadamard 不等式.几何 
上 | det A | 是 ri 维平行六面体的体积，它的各生成边是由 A 的各行（或各列）给出的.当各生 
成边相互正交时，这个体积最大，而这时其体积是各边长的乘积 . Hadatnard 不等式是这个几 
何不等式的代数描述. 

7.8.2 推论 （ Haciamard 不等式）对十仟意矩阵《 = ]6兄„，有 

| ^^ |< n(S I k i ： ) r2 

，=】；1 

和 

\K I 2 ) 1 ". 

azz ] 此外，等式成立当且仅当 b 的各行(相应地! 相正交. 

证明： 如果 B 是奇异矩阵，那就没有什么要证的.如果 B 是非奇异矩阵，把 （7.8.1) 应用 
正定矩阵4=63、然后取方根.第一个不等式右边是 A 的各对角元的乘积的方根，而左边 
是 detA 的方根.当 A 冓对角矩阵时，即在 (7. 8.1) 中等式成立的情形恰好 S 的各行互相正交. 
把第一个不等式应用于 B •便可推出第二个不等式了 n 

练习我们已经从 (7. 8.1) 推导出 （7.8. 2>.现在证明 （7, 8. 1) 可由 （7. 8. 2) 推出. 提 示：如 
果 A 是正定 矩阵，则存在唯一的 IH 定矩阵 B 使 S 2 =4. 把( 7 . 8. 2) 应用于 B 和它的平方. 

练习你能利用 Hadamard 不等式(及其变形）给出 
-1 

del 1 
.1 

的最大界吗？ 

对关干正定矩阵的 Hadamard 不等式作出改进的两个推广应归功于 Fischer 和 Szasz . 在 
Fist ’ her 不等式中，4:佘主子矩阵所起的作用相当于对角元在 Hadamard 不等式中所起的作用. 
7.8.3 定理 （ Fischer 不等式）假定 



P 


'A B1 

jr cj 
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& 庀定矩阵，其中子块 A 和 C 是非空方阵（参看本节 U 题).则 
det (det A )( dt > tC ) 
证明：设 — 然后算出 



= (det A)(det[C-ii' A-'UJ) < (det AKdet C) 

后一不等式用到了 （ 7. 7. 6) 和 （ 7. 7. 4b) 以确保 (let Odet(C—iJ* A—fJ) , 这是因为， C>C~ 

B，A ' B >0. □ 圆 

练 3] 试从 Fischer 不等式推导出 Hadatmrd 不等式 （7. 8.1). 同时，试对于比 （7. 8. 3) 中 
的分块（两个主子矩阵）要细但乂不如 （7.8.1) 中分块 （n 个主子矩阵）那么细的 F 的分块，提出 
并叙述 Fischer 不等式.注意，在这种情形， Fisher 不等式的右边小于或等十 Hadamard 不等 
式的右边.因此，关于加细的各种分块的 Fi sr h er 不等式给出关于 det P 的上界的一个单调不 
减序列. 

存在另一种不等式，它给出关于行列式的一系列上界， 乜包括 Hadamard 上界.设 
表示 A 的所有走 X 6 主子式[共冇个]的乘积.我们注意到， P „( A)-det A , rfn P ,( A ) = 


7.8.4 定理 (Sza SZ F 等式）如果 A£M„ 是正定矩阵，则对所有 4 = 1, 2 ,…， ，广 1 有 
P *, i ( A)^ lrI ^ ’ 

证明： 因为 A 1 的各对角元正好是 A 的各 h — l) X( H —1) 主子式与 det A 之比，把 
(7. S . 1) 直接应用于正定矩阵 / T 1 便推出 

di?A - det A 

剛 

1\{AY ! = (det A)"" 1 <P,.,(A). 

对这个不等式的两边取 (7; — 1) 次方根便得出 Szasz 不等式组屮 k~-=n-l 的情形.余下情形可以 
归纳地导出.例如， 对于々 =» — 2的情形，我们把每个<»—1)乂（ ?; 一1)主子矩阵看作一个起姶 
矩阵，然后应用上面的不等式得到 


<P„ 2 (^) ? 

因为 A 的每个 (》 — 2)Xb — 2) 主子矩阵作为 A 的某个 (》 — l)X( n — 1) 主子矩阵的主子矩阵出 
现两次 . 对两边取 ( 》 —1)(« — 2) 次方根得 A = n — 2 的情形，而余下的情形可用同样的方式推 
出 . □ 

练习证明 Szasz 不等式蕴涵 Hadamard 不等式 （ 7 . 8. 1) . 其中等式的情形是什么？ _ 

7. 8.5 论断设是 半正定 矩阵，且定义 


a(A) = 


「哉，姆 A ” 是正釀 

-0, 否则； 




3 i 0 


第？章 


晒 


其中是划去 A 的第1行和第1列而得的 A 的 （n -l)X(n-l) 主子矩阵.设 EneM„ 是其 
1.1 元为1,而所有其余元为0的矩阵.则对所冇 A —(E u 是半正定矩阵，而对任意 
出,，不是半正定矩阵；特别是， A — 是半正定矩阵. 

证明： 只要考虑 A 是 iK_ 定阵的情形即可.将（？. 2. 5) 应用于各“ 尾随” 主子式.注意到 A- 
出1_的前 fi — 1个 M 随主子式与 A 的相同，且 det(A —?E u ) = dct A —f del □ 

练习 给出 （7. 8. 5) 的证明细作. 

练习 试用 <7. 8 . 5) 归纳证明 Hadamard 不等式 （7. 8. 1 ). 
flaciaman) 不等式 （7. 8. 1) 也可以用 Ilatiamani 乘积叙述为 

(det,4>n ] 在鈿 /U L 

r-I 

下述定理是 Oppmheim 的不等式 (被 Schur 强化了 > ,它说明在上述不等式中单位矩阵的作用 
没有什么特殊的> 从而推广了 Hadamard 不等式. 


7.8.6 定理 ( Oppenheim 不等式）如果 A , 是半正定矩阵，则 


(det A ) S ； det A o B . 

t=l 

证明： 我们对 N 采用 C 纳法，对》=]，结论是明显的.如果且对阶数至多为 ”-J 
的所有矩阵，结论成立，则由 C 纳假设可知 

(det An ) JJ < dc-i A n " Bu , 

j = 2 

其中的记号与 （7. 8. 5) 中相同，注意 A u « = (A • ii ),,■ 因为 A — a Eu 是半正定矩阵，由此 

得知 (A — 。 B 是 f 正定矩阵，因而 

0 ^ det (.4 - oh'n ) " B = (det A 。 (tkt An 。 ), 

由此可推出 


练3 
进而证明 


det A - aintJet .4,, 。 Bu ah, (tkt A],) ~ = (det A) ]j6 rl . 

如果 A , seM „ 是正定矩阵，证明， ' 

(det AKdet B ) ^ det A » B 


'* H ?r 

(det /\)(det B ) < (del A ) < det /I - « < | JJJ b ,. 
练习如果是正定矩阵，证明 derA»A '>1. 


—种类型不同的行列式不等式适应子其是正定矩阵的非 Hermite 矩阵 A . 
作关于 复数的不等式 I r I >丨 Re 2 | 的推广. 




它可以看 


7-8.7 定理 （ Otrowski - Tm 】 ssky ) 如果 AGM , 使出 A ) = ( A 十 A . )/2 为正定矩阵，则 
detH ( A ) <| del A !. 

等式成立当且仅当/\是 Hormite 矩阵. 




证明： 设 S ( A ) = (A — A ' )/2, 因而 : A = H (/\) 十 MA ). 于是所要证的不等式可述为 
I det [/- f - H ( ArS ( A )] 1. 

但是 H(A) 3(_4)相似于斜 Hemiite 矩阵 

H(A) r \S(A)H(Ar' 

因而它只有纯虚特征值.因此只要注意到 I 1 +々| 对任意实数 f 成立就可以了.如果" 
込，…， A 是 U ( Ar ' S ( A ) 的特征值，则 

I dct[7+H(/\) 1 S(A)] |= II | 1 + ir, 1. 

} ! 

另外，等式成立当且仅当所有1=0,它等价于 S (_4)=0, 这是 W 为斜 Herinite 矩阵是可对角 
化的. □ 

含有两个正定矩阵之和的重要行列式不等式属于 Minkowski . 它的证明与上述结果 类似. 
7,8.8 定理 (Minkowski 不等式）如果 A , BeM „ 是正定矩阵，则 
[ det(A I . R )] 1 " > (dft . AJ '^ + Cdet B ) 1 '. 

证明： 注意到所要证的不等式的两边是同次齐次的，用 （detA 1 2 ) 1 ，" 乘其左边和右边.于 
是，不失 - 般性，可以假定 A = 〖， 且必须证明 

[ det(i + B )] 1，n > l + (Het 

如果 CKlg — SA ,, 是 B 的特征值，则所要证的不等式等价于 



只要直接计算不等式两边，然后用算术-儿何平均值不等式逐项进行比较便可证明这个不等 
式. □ 

练习 给出 （7. 8. 8) 的证明细节，并且证明等式成立当 R 仅当 = 对某个 ( •会0成立. 

习题 

1. 不等式 （7.8.2) 说明，行列式的大小可以用其各行的0范数的乘积來 佔计. 试把它同如 
下结果[见 (6.1) 节习题 3] 作一比较：行列式的大小可以用其各行的 A 范数的乘积来估计.几 
何上，这每一个界表示什么？还有其他这样的界吗？试一试 

2. (7. 8. 2) 的左边在 B 的左酉乘法下不变，而 (7. 8. 1) 的左边在 A 的两相似下不变，但是， 
两者的右边都无相应的不变性.什么时候两个右边达到极小？什么时候它们达到极大？能用这 
种方式得到较好的界吗？ 

3 - 试用 Fischer 不等式验证 Hadamartl 不等式 （7. 2 ) 的下述分块形式的推广：设 ; A = 

「 AJ 是分块复矩阵，使得毎个子块 A v eJW ,. 于是 

I d et a i< [n (2 }A tl ||) 1，Z 

除 r 这里所采用的谱范数以外，还可以用其他矩阵范 数吗？ 

4- 试确定 （7. 8. 6) 中相等的情形. 

5.设 A , 是正定矩阵，试证 




342 


第？章 


del A - B+(det AKdel E) ^ Cdet A)]J^ + (det 

r-1 i=i 

说明这强化了 （7. 8. (5). 提示：证明 

a ( A 。 B ) ^ a ( A)^ M 十 a ( B ) a n — a ( A ) o '( i 3), 
然后把它应用于普通的归纳假设. 

6. 证明，可以进一步扩展上一个习题中的不等式得到下述不等式 


det A ^ i 3 + <det A)(det B ) 


det An ^ Bjj 
Cdet Ah ) (dot B (1 ) 


> Cdet A) 迫 >„ + (d e t B) 益 >„ 十 （det A)* ll (det -1) 

+ [ detCB ) a„(det 

7. 如果有正定 Ilermite 部分 H=(A + A ‘）/2, 且《>1，证明 （7. 8. 7) 巾的不等式 
可以强化为 


detH(A) -f | detS(A) KI det A | . 

什么情形下可取等式？ 提示： 你必须证明 

I W ]( 八） 5(/1)..| [>l-f I detH(A) I S(A) |, 

[483] 这等价于有 

n 1n-n u, ! 

厂 I ! = \ 

证明 

n 1 1+",卜 i + i >;+ …十 ne 

广 1 j^i j=i 

> i+«n^+(fr^；) 3 ^ (i+n I ^ i) 2 - 

你可以进一步强化这个不等 式吗？注意% 所论证的不等式关 ykis [的一个 自然形式应该是 
I « I > I Re ^ | + | lm s | f 而所论证的不等式可以看作它的推广；证明这个自然不等式不 
成立（因而假定 n>l) f 由此可见要证的行列式不等式有点出乎意料之外. 

8. 如果 A，B6A 1 是正定矩阵，证明 + + 

9 . 试用 Miniiowslsi 不等式证明 Fischer 不等式 • 提示： 把 Minkowski 不等式应用于两个 
正定矩阵 

O m _.;H— ; —3. 

10. —个正定矩阵 P ^ M „ 可以分解成尸=厂厂，其中 L 是只有正对角元的 下一. 角矩阵 
(7.2.9). 试用这一事实证明 Fischer 不等式. 

1]. 设 A, 是半正定矩阵.如果 A 和 B 是非奇异的，证明 A 。 B 是非奇异的（且是 

正定的 h 如果 A。S 是奇异的，证明 A. _B 至少有 -- 个是奇异的.这与 （7. 5) 节的不等式 ran k 
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A 。 BC(rank A)(rank ii ) 有何关系？ 


12. 证明，如果/ \ = 是一个具有实元素的矩阵，且 U ; 丨<1，则 I det A | <3 V 3. 

R 1 时证明这个界是不能达到的. 提示： 

— ^― (<iet A ) - - (― 且 -^-Cdet A ) = 0, 

^ a „ 

其中凡 ，是 A 划去 A 的第 ; 行和第 j 列的行列式.如果 .A,, =0，则 det A 与％的值无关，因而 
〜可取 ±1. 如果 A v #0, 则当0<〜<1时， detA 关于 s 没有极值.因此，在 所有〜=±1 
的给定的约朿内， i det A >达到它的最大值.对于„ = 3 ， 只有有限个这样的矩阵.一般地， 
对于„>3.其结果乂如何？如果 A 有复元素.则对解折函数应用最大值原理（最大模定理）证_ 
明，在集合彳 A6M,,: 所有！ \ | 内部 | det A I不可能有最大值. 

13. 如果 A = MK = tnax { | a , ; . | h 试用 Hadatnard 不等式证明，| det A | 

1 4 . 设 A 6 JW , 是止定矩阵，又设 o £/ V = U ，….是一个指标集‘ Fischer 不等式可以 
叙述为 dm A<det A( a )det 4( 〆 ).其中</是 a 关于 N 的补集.这个结果的一个推广常称为 
Hadamard-FischeT 不等式，那就是 


det A(a U < 


det A { g)det A {^) 
det A(a fl ^ 


(7,8, 9) 


它对正定 Hermite 矩阵 .4 和所有指标集 《，成立. 通常规定 del e 1. 试仅用 
Fischer 不 等式和 （ 0. 8 . 4) 中的第二个公式证明 Hadamnrd - Fischer 不等式.提示：不失一般性， 
假定 aU ;3= N ， 且把 Fisher 不等式应用于 A 然后把 (0. 4 > 应用于每个子式. 

15. 利用正定 Hcrmite 矩阵可以写成 LL ' 11 L 是非奇异下一:角矩阵的事实 （7. 2. 9>给出 


Hadamard-FLscher 不等式（ 7 . 8. E )) 的立接证明.提示：假定 l <；)<々< n , 不失 一般性 ，假定 


a ={ l , …， H 和…， 出•…，此 然后考虑 A 和 L 的一个对应的 3 X 3 子块. 
16. 设 A 6 M ,, 是正定矩阵.试用 Hadamard Fischei ■不等式（ 7 . 8. 9)证明 


XI det A ({ iJ + U ) 
如.4(」 一 “ - . 

n > 

/=2 

1?. 设 AeM „ 是正定矩阵.证明 


det A ••= min{ : { v , , •■- , u „} C C ™ 是标准 TE 交组}. 

提示： 设 V =[ v , …％] 且把 （7. 8. 1) 应用于 AV . 

18‘设 A 6 M ,, 是正定矩阵，且设 U ,, …，是标准正交组.试用习题17旺明， 
<«』，•■•，《» } 是乂的特征向量且 U ; Aw t ， •. ‘， a ,:/ i “ J 是 A 的相应特征值，当且仅当 g 画 

rfet ^ = JJu . Au ,. 

19. 如果是正定矩阵，证明 







344 


第 7 幸 


„(dct A) ] ^ J - min{tr AB i B ^ M n 是正定矩阵且 det B = 1}. 

» 示： 记 ， 其中， A-diagCAM A N ), 所有 A t >0, 且是酉矩阵，于是 u 
AB = xtA(U^ BU ). 然后利用 算术一 几何平均值不等式和 Hadamard 不等式 <7, 8. 1 ) 证明 

— 2 认多 y r ^ (det ^]T^ n ^ [det A] 1 % 

11 r= I 】 ] 

且等式可以成立 / 

20. 试用习题 19 中的拟线性化证明 Minkowski 不等式 (7. 8. 8) 

21. 设 A6M„ 是半疋定矩阵，且把 A 写成分块形式如下： 


试用 (4. 1) 节习題 15 中关于行列式的简化公式和【 7. 2) 节习題 U 址明 
det A = a u det A — 丄 ’ (adj 4).c < ttj, det A. 

试用归纳法和这个不等式给出 Hadamard 不等式 (7. 8. 1) 的另一个证明， 

进一步阅读 关于定理 (7.8.7) 的其他信息可参看 1\1.0 你 0 奶 1^ !1 (10.1' 3 1 1 —7,* 1 ()11 
the Variation of the Determinant of a Positive Definite Matrix," Pruc. Kon. NederL Acad. 
Wetenufi. Amsterdam, Ser. A, 54 (1951) > 383-385. 有一类不等式（丐 A 是正定矩阵时）把 
det A 与 A 的其他广义矩降函数 （KL 0. 3 . 2) 联系起来，同时也推广了 Hadamard 不等式 
(7. S . 】），其有关的内容可参看 I. Schur, “Ober endliche Gruppen und Hermitesche Formen,” 
(486] Maf/i. Z. 1 (1918), 184-207. 
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8.0 导引 

假定有，,>2个城市…，它们之间的人口流动情况如下所述：对所有; 关）， 每天 
上午8: 00同 时从） 城到/城去的流动人口的正常比韦.是 ; '城的流动人口仍留在 J 城的比 
率是因此，如果 用户厂 表示第 m 灭,城的人 U 数.则有第 m 天与第 m + 1 天之间的人口 
分布递归艾系 

= 知户 1 〆 + …+ 〜 〆,"' 1 ， i 1,*-- m = 0,1 

如果用 A = [«, J 表示由人 U 流动系数组成的《父”矩阵，且用/>_=[夕^]表示人口分布向 
tt . 则 

〆"…’= Ap'" !, - AAp :m 11 = •- = ^ Uill /> un > m -= 0 ， 1 ，…， 

其屮 〆 m 是初姶人口分布向因为系数&表示流动人 U 比率，所以，对每个 j ' = l , 1,…， 

n , 有 O ^^ l , 且 ^ a ,, = 1. 

J - 丄 

为了对城市服务以及资金投人作出切合实际的长远规划 t 行政人员想知道*从现在到遥远 

的将来，总的人口 将如何 分布； 即他们想知道，对大的“的渐近变化过程. 

f 0. 是，因为所以显然必须考察的渐近变化过程. 

例如 * 详细考虑 fi = 2 的情形. W 为 cj „ I u 21 = l = u LJ 1 a, 2 , 如果 iC = a 和 u !2 =^， 则有 



我们想知道.对大的 A ™ 等于什么？如果 A 是可对角化的，则可以直接计算 A ™. 从计算 A 
的特征值开始：八 = 1* A ,=1 — 江 W 为 0< a . ^<1,所以 = U , : = I 1-«-(3| , 
于是有1= I 丨= 〆 . 4) 旦 .4 的谱半径是 A 的一个特征值.男外，除了在„=^=0的平凡情形 
(在这种情形， A 是可约矩阵）以外，我 们看到 A 2 =# A ) 是 A 的单 fi 特征值. 

. 如果《十_0,相应的特征向 m 是 a .. r (对于; i :.= i ) 和 z =[ i ，一！] t (对于 L ), 所 
以在这种情形 A 是可对角化的且 A S ^ S - 1 ,其中 



注意，如果 A 是不可约的，则特征向妯/的分量是非负的和 TK 的. 

如果 a 和戸 不都是 U 则 U , | = | l'-tr j 3 | <1,因而当时耵 -，0. 因此，在这种 
情形，有 

lim /V" = S(lim AW〗 = Sr °ls 1 - ^l, 

『》-- Lo 0 」 a + a 」 

因而平衡人口分布是 
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，一忐[:: KM . 

注意，平衡分布完全与初始分布无关.矩阵 A ™ 趋近于一个极限，这个极限的各列与相应于特 
征值 1( 它是的谱半径）的特征向成正比，而极限人口分布与这同一个特征向量成正比. 

对于上面没有处理的两种例外情形不难逐一分析.如果《=#=()，则 = 
且^ j = p 10 ', 所以极限分布与初姶分布不是无关的. 

如果《=^士1，则且两个城市逐日调换它们的全部人口. A 的幂不趋近于一个 

极限，并且，如果初始人口分布是不平衡的，则人口分布也无极限.但是，在“均值平衡”的意 
「 函 义下，它们都可达到一个极限，即 

，去 .HD * ，詰，：^ [: } 

总之， 从这个例子得知，并 a : 

1. 谱半径 〆 A ) = l 本身是 A 的特征值，而它不只是特征值的绝对值. 

2. 相应于特征值 〆 A ) 的特征向董 I 可以取非负分 M ， 如果 A 是不可约的，则分量是 
正的. 

3. 如果 A 的所有元都是正的，则 〆 A ) 是具有严格最大模的单重特征值. 

4. 如果 A 的所有元是正的，则存在，且是秩1矩阵，它的所有列与特征向 
量 x 成正比. 


_ 


5. 在所有情形 limU / mjflCA / yA ))* 存在. 

实际上这些结论一觖对是成立的，不过用上而所述的简单而直接的方法不可能分析 
研究一般情形.例如，当时，即使 A 的所有元素都是正的， A 也不一定可对角化.这就 
需要新的 T 具， 这正是本章的其余部分要阐述的内容. 

习題 


1. 证明，矩阵 A=U U 有谱半径1,但是当 CO 时 A ™ 无界. 

2. 考虑矩阵 

r i_ 」_ 

-e ] +< 


> 0 . 


( a ) 证明， A z =l 是 A 的单重特征值，且1> U I . ( b ) 证明 

" = TT^C] ^ ^ =1 2r[[] 

分别是怎和47相应于特征值 A = 1 的特征向暈 • < c ) 直接计算 Ar ， m^U 2, ( d ) 证明 


lim A； h 


ic n- 
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⑷计箅 并作出说明. （ f ) 如果会出现什么情形？埔示：然后如 
正文中那样对角化氏. 

3. 从人口 A 由流动的观点来说明，由城市间的人口流动系数组成的一般矩阵是不可约的 
意味着什么. 

4. 对于在本节中所讨论过的两个城市的例子，试证明，在 a = j 3=0 以及的情形下 

lim ( l / m ) 存在.在每种情形下的极限各是什么？ 

一 * = 1 

进一 步阅读关于正定矩阵和非负矩阵的性质的丰富信息，以及许多理论与应用的参考文献可 
见 [BP1] 和 [ Sen ]. 在 [Var] 中，有一个特别注重数值分析应用的关于非负矩阵的诸多结果的综述. 

8-1 非负矩阵一不等式及其推广 

设 b =[% ] e 和 a = [ a „ ] e m „.,. 记 

B> 0 , 如杲所有~>0; 

B>0, 如果所有心 >0; 

A^B , 如果 A — 

A>B, 如果 A — B >0. 

类似地可定义反向关系<和<+我们定义 | A 1三 [ | \丨 ]. 如果则称 A 是非负矩阵， 
乂如果 A >0, 则称 A 是正矩阵.下列简单事实可直接由定义推出. 

练习设 A , BeM ,. r . 证明： 

(8.1.1) I A I >0对毎个 A 成立 ； I A 1 =0 当且仅当 A = 0. 

(a l -2> I M I = U 丨丨 A I 对所有 《6 C 成立. 

(8.1.3) 丨 A + B [ < I A I + I B I . 

(8. 1.4) 如果且 A^O, 则当 n 或 r 大于〗时 A> 0 不一定成立. 

({!•]■ 5) 如果 A >0, B> 0 , 且“， b^O , 则 沾 >0. 

(8. 1.6> 如果 且 C > D , 则 A+OB + D . 

(8. 1.7) 如果 Aga 且 则 

练习现在假定 A , H , r , D 6 M „, y(^C. 证明 ： 

(8. 1.8) |Aj I < I A 11 .r I . 

(8. 1. 9) MB I < I A H 尸 f - 

(8. 1.10) A " I < I A l w 对所有 m = 2, …成立. 

(8.1.11) 如果 0< A<B 且 PJ O^ACs^BD. 

( S . 1. 12) 如果 0< A < B ， 则 0< A *"< F -对所有川=1， 2, …成立. 

(8. 1.13) 如果 A >0, 则 A m >0; 如果 A >0, 则乂">0对所有 m = l , 2,…成立. 

C 8. 1. U ) 如果 A >0, . r >0 ( 且; r ^ O , 则九 r >0. 

(8. 1. 15) 如果 i >0 且 A_r = 0, 则 A = 0. 

(8.1. IS) 如果丨,4 I < I _B 丨，则 || /U| 2 < || B||,. 

C 8.1-17) || A | j ,= || M I II ,. 


[4 M 1 
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显然， 最后 两个论断对任意绝对范数都 成立， Frobenius 范数范数）只是其中一个例子. 
这些简单关系首先可应用于关于谱半径的不等式. 

8.1.18 定理设 A, B6M,,. 如果 I < B , 则〆 A)<〆 | A 
证明：对毎个 ™=1, 2，…，根据 （8. 1. 10) 和 （8. 1. 12>，有 
根据 （8. 1. 1S) 和 （8. 1. 17). 对所冇 "!一]. 2,…，不等式 

II A- II,<|| | A |~ L(||B ™|| 2 和 |iA™ Kll I A 卜 
在设 m—oo 且运用 （5. 6. U)， 便导出 pCAX〆| A | 

8.1.19 推论设 A，B6M„. 如果 0<A<B, 则〆 A)< P (B). 

8.1_20 推论设 A£M „. 如果乂如果 A 是 .4 的任一主子矩阵，则〆特别 
是， max, , „ ^(A). 

证 明：设 fi 设 A 是 A 的 nr 主子方阵.设 A 表示把 A 的各元排放在它们原来 
的位置(作为 力的元 〗 而把0元放在其余位置所构成的矩阵.于是〆且 o<A< 
A , 所以根据推论(8」. 9>可知， P ( A )^ P < AX , P ( A ). □ 

对 T 一个不」定是 Hermite 矩阵的谱半抒来说，上述推论中的下界 < pU ) 是得到的第 
_ 一个普:平凡下界，不过 A 为非负的假定是本质的. 

练习试构造一个相似于= j 的矩阵，且不含零元.它的谱辛-衧是什么？它是非负矩 

阵吗？义于推论 (8. 1.20) 的后-部分，这说明什么问题？ 

练习 ilt 明，如果 « eJW„, \ 10 ^ A < B , 则〆 AXfXBh 提示：存在某个 《>] 使得 
0 ^ A ^ aA < B . 如果〆 A)，0, 则从推论 （S. 1. 19>可得出结论，如果〆 A)=0. 则把推论 
(8. 1.20) 应用于 B 可得出结论. 

因为我们马上就会有关干非负矩阵的谱 t 径的较好上界，定理 (8. 18) 将用来求任意矩阵的 
谱半径的上界. 

8.1.21 引理 设且假定 A>0. 如果 A 的各个行和是常数，则〆 A> = i|A|.,. 如果 
A 的各个列和是常数，则〆 

证明：我们知道， ^A)<| A I对仟意矩阵范数|| 成立，但是，如果各行和是常数，则 
/ = ◦，•‘-， IT 是关于特征值 |||A _| 的特征向 M. 把同样的论证应用于 A「 便得到乂于列和的 
论断. □ 

8.1,22 定理设 A6M„, 且假定 A>0 .则 

min Va.j <p(A) < max Vu,, <8.1.23) 

a 

min Ya ,, ^ piA ) ^ max (8, 1, 24) 

u l_.,， % _ f 


I AM < I a w 此， 


II B - II，成立，如果现 
□ 
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证明： 设《= 1^11^>。.然后构造新矩阵川使4>^彡0，且2\三^对所有，=】，匕”. 

E; :〜〜 1 j-i 

成立.例如，如果 a = 0,令 B = 0,乂如果 a >0, 可以令心 ] .根据引理 ( S . LZ1), 

J -1 

^ B ) = a ，又根据推论 ( S . ] . \ 9 ), p ( B >^ piA ). 相应的上界易用类似的方法来 M 明.把行和界应 
用于义^便得到列和界. □ 

练习 证明上述结果中关于上界的论断. 


8.1.25 推论 设 A 6 M ,. 如果 A >0, 且对 所有！ = 1，2,…， ，，有 >0,则 〆 A >>0 .特 

别是，如果 A >0,或者如果 A 是不可约非负矩阵，则 〆 A )>0.' 

练习 证明不可约矩阵不可能有零行或零列. 


因为只要 S 可逆就有 〆 所以可以引进某 些自由 参数来推广上述定理.如 
，…， x „), 且所有 i >0, 则当 A >0 时 S — i / VSX ). 把定理 （8. 1.22) 应用于 
= ' J , 便得到下述更一般的结果. 


8.1-26 定理 设 A 6 JW ,,, 且假定 A >0. 则对任意正向量; r 6 C '，有 


.Sw < p ( A ) < 




(8.1.27) 


min.rj ^ ~ < P ㈤4 maxa 、 (S. 1. 28) 

卜: • - 1 • ; - ) -ip I ■•• j f • >r j = 1 - J ' r 

8.1.29 推论 设 AGM „, J -6 R ", 且假定 A >0 和 j .>0. 如果 a , 府 0 使 aJ < Ar ^3 j ■，则 a 
< p ( A )^. 如果 a _ r < Ar , 则 aC ^ A ); 如果则户 MXp . 


证明： 如果 cw < Aa 则由定理 (8. 1.2 fi ) 得知如果虹 < 

Ar , 则有某个 a '> a , 使得：^'<.4二在这种情形 〆 A ) ^ ( /；> £f , 所以 〆 A )> a . 类似地可证明 
t 界. □ 

练习 完成推论 (8. 1.2 W 的证明. 

S .1.30 推论设 AeM „ ，且假定 A 非负.如果 A 有正特征向量，则相应的特征值是 〆 A ); 
即如果 Ajmx >0 和 A >0, 则义=广(力). 

钲 明： 如果，>0昆 Ar = A _ r ， 则 A >0 且; U '< Ax < A _ r . 另一方面，由推论 （8. 1. 29) 可知， 


國 


8-1.31 推论 SA 6 M ,,, 且假定 A 是非负矩阵.如果 A 有正特征向量，则 

练习 证明上述推论. 提示： 在 (8. 1.27>中采用正特征向量: 

S .1.33 推论 设 A 6 M ,,. 且假定 A 是非负矩阵.如果 A 有正特征向量 _ r , 则对所有 m = j , 
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M8f 


网 


2, …和 所有； =1, …，心有 


2 >r < 


max . r k 

U.n 

P<.Ar 和 

min jCf , 

1 ..： kf n 

min 

max 



|>;广， 

j = l 


C & l . 34) 


其中特別是，如果 〆 a )> o , 则对 ™= i ， 2,…， [ yArM ? ■各元一致有界. 
证明： 如果则 A ， = 〆 々)％.如果 ASsO ， 则 / V°>0， 且有 


p(Ar max i o ( A , "). j- i = [ A "' j -]』—, 

> (土，)客 <" 

对仟意， =1, 2 , …， 》 成立.因为 .r>0, 所确定的上界对由除法得出.类似地有 
p(Ar = [ A ^ J ； = 


< ( max .。） 乞心'、 

对任意 f = l , …，"成立.因为所确定的下界可由除法得出. 

习题 


□ 


1. 如果/\>0,且对某个々， A *>0, 证明 〆 A)>0. 

2. 给出一个 2X2 矩阵 A, 使得 A>0, A 不是正的，且 A>0. 

3_假定 / A >0, 且 A 乒 0. 如果 A 有正特征向景，证明〆 A)>0. 

4 . 如果〆 A><1， 我们知道 t oo 时 A"'—0. 如果 A>0, 11A 有正特征向量，试用 

推论 (8 .1. 33 )证明， I A» | s^(AV"C(A) 对所有 m=l， 2,…成立，其中 （:(A> 是常数矩阵. 

试考察 a=U U， 说明 A 耵止特征向量的假定不能省略.试从推论（5.6.〗3)来讨论这两个 


结果. 

5. 如果 A>0 有特征向量，证明 A 相似于其各行和为常数的非负矩阵.这个常数是 什么？ 
提示： 利用定理 (8.1,26) 前面的注释. 

S. 我们将在 (S. 4) p 址明，非负不可约矩阵必定冇正特征向量.说明非负矩阵可以有正特 
征向景而且是可约的. 

7 -设 A=[u,,]eM„ 是非负矩阵且有正特征向量 J_ = [. r ,]. 试用 (Ji. L 33) 证明， 

' 」 '1 
min jr k \ 

^^7|<11^/广对每个|=1，2,.‘‘，《 成立； 

max 2 t ； 1 ... p^, ,i 

n ” j 

⑹⑻对每个： ：1， 2，…， n 成立 ■ 

对所有2，…，记 
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8.2 正矩阵 

对正矩阵来说.非负矩阵理论显示出它的最简单和 ft 优美的形式，关于这种情形， 
O . Pemm 在1607年做出了主要的贡献. 


8.2.1 引理 a A e M „, 且假定 A >0, A .< j .尹0，以及 U I =^< A >. 则 A | x | = 

p(A) i I 且丨 I I >0. 

证明：计算 

pCA) I x I = I A I ! .r I - I Ax i = I Ax I < I A I t I =A I x I 
因而 I JT i —p(A) 1 2- I >0，因为 .r I ^0 Ji. 1 J- ! 7^0, 所以由 <8* 1.14) 可知 A 1 >r | >0 .又 
推论氓^褓证〆〜〉。，所以，当尸0时有 AU'| =p(A)M 和 U1 ^CA) 'A| j-j>0. 
如果 y 尹0,令 s=A|j'|>0, 再运用 （S. 1.14): 

0 <. Ay = Az - ( O ( A ) i ■或 Az > piA )z 

但是根据推论 ( S . 1.2 f ))， 我们有荒谬的结讼 〆 A )> 〆 . 4 ). 从而得知 y = 0, 证毕. □ 

由这个技术性引理，容易推导出关于正矩阵的第一个基本结果. 

8 - 2.2 定理设 4& M „, 且假定 A fi 正矩阵.则 〆 / U >0, p ( - 4) 是 A 的特征值，且存在正向 
量：使得 Ar = jO ( A ) x . 

证明： 存在特征值 A , 且 U 丨 =/ A )>0 , 而相应的特征向量根据引理.所要求的 
向量是丨 ■!_ I . □ 

练习如果 ji / l >0, 试用推论 <8.31) 证明 

p( 」 4) ; max min — = mm max 丄 

〜 i ^ i>：=n . r , pr[ >->o x r 

只要稍微强化一下引理 ( 8 . 2 . 1 ) 的叙述，就可以加深对 a 的特征值的估计的认识. 

8.2.3 引理设 A 6 H ,， 且假定 A >0 ，kx = \x， r 矣0，以及 I A 1 = p ( A ). 则对某个 fltR , 

e J V= I .i' I >0. 

证明： 假设条件保证 I 九 r I 二 I A - t . I = (0 < A ) III , Ji 由引理 （ S .2. 1) 可知， A 丨 a . I = 
p(A) I .r I R U - I >0. 综合这两个恒等式和 -角不 等式，对每个 6=1, …，„，有 

/ o < A )| , r , 丨= 1 I 丄， I =: 1 二 I 土 w , I 

p- i 

>1 n 

< 2] I 11 ! = 2 a n> 1^1 = (0(A)I JT* 1. 

因此，在二角不等式中等式必须成立， W 而（非零 )" t 数 A〆 ，， P =1, 一 定都位于复平 

面的同一条射线上.如果用(?表尔它们的公共核角，则 f — 对所有户=1,…，„成 
立.但是， 闲为所 有％> 0 ,所以有厂 ' V > o . n 

8.2.4 定理设/\&衂„,且假定 A 是正矩阵.则对每个特征值 A 乒 〆 A ) 有 U | < p ( yi ). 

证明：根据定义 ， I A | < 〆 /!)对 A 的所有特征值 A 成立.假如 | = P ( A >, 且如= 


_ 
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^^0. 根据引理 （8. 2. 3), 对某个 6 eR 有 w 二" ^->0, 所以 Aw = Au ，. 但是根据推论 
( S . 1.30) 有 A = p ( A ). □ 

现在我们知道，如果 A >〖)， 则 〆 A ) 可以看成严格最大模特征值，而不会有其他可能性. 
[4961 下一个结果说明， 〆 是儿何重数为1的特 征值； 即相应于 〆 的特征空间有维数 1. 实际 
上，我们马上就会看到， p ( A ) 的代数重数也是]. 

8. 2.5 定理 设 ACM ,」， 且假定 A >0, «； 和之是适加和 As 的非零向虽. 

则存在某个 crGC 使得 W = 

min y ,/,, 1 且定义 req — 沖. 注意到且 r 至少有一个坐标为0,所以 r 不是正向童.但是 
Ar = Aq - pAp ^ p ( A ) q -- l 3 p ( A ) p = piA ) r , 所以，如果 r 乒0,由 <8. 1. 14> 可知， r = p ( A)~ 1 Ar 
>0. 因为这不成立，得出 r =0, 因而 <?=仲且 □ 

8. 2.6 推论设 AeM_，R 假定 A >0. 则存在唯一向量了，使得 Ar = 〆 /^， i >0 且 

j - 1 

= 1 . 

练习址明推论 (8. 2. 6〉. 

推论 (8. 2. 6) 中所描述的唯一的正规化特征向量常常称为 A 的 Perron 向量； ， A ) 常常称 
为 A 的 Perron 根.当然，如果 A 是正矩阵，则 A 1 亦是，所以，上述所有结果也可以应用于 
A T . A T 的 Perron 向坫称为 A 的左 Perron 向董， 

练习如果 A 6 JW ,, 且 A >0, 乂如果存在某个使得 _ r >0, _ r 乒0,且 Ai = Aj '， 
证明 j ' 是 A 的 Perron 向量的倍数且 A 

我们对研究 w — co 时幂的变化过程感兴趣，因为这些幂出现在数值分析的应用中以及 
概宇■论中的 Markov 链理论的应用中.下面的引理把对于非负矩阵的各个极限定理是本质的诸 
条件分离开来.注意，如果 A >0 . RA =^/ U , 则所有假设条件都适合. 

_ & 2 . 7 引理 设 Ae 吡是 给定的矩阵， A 6 C 是给定的数，且假定 和: y 是适合 

(1) Aj^Ax ； 

( 2 ) A J y^ky-, 

(3) — 1 ； 

的向量.定义贝 j 

( a ) 

( b ) L 对所有 m = l ， 2，… 成立； 

( c ) A™L = L 7 T = A "丄对所有 m = l ， 2, …成立； 

( iJ ) L {.4- AL )=0( 

( c > ( A — ALr = A 〜一 rL 对所有 m = i , £，…成 i ; 

( f ) A-XL 的每个非零特征值也是 A 的特征值. 

如果另外还假定 
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(4) A^O 

(5) A 是的 A 的特征值，且有几 何重数 1;于是还有 

< g ) A 不是 A -_< a 的特征值；即; C 4— U ) 是可逆矩阵. 

最后，如果假定 

(6) | A | - P ( A )>0 i 

(7) A 是 A 的模为〆 A) 的仅有特征 值； 乂如果把 A 的特怔值排成顺序 |A t I < | A: I <- 

I I 1〈 I I = i A I 则 

( h ) pCA - A/.X A „ ! ! <>tA ) i 

( i ) 时， l A - Lr ^ L t 

( j ) 对每个适合 [I A ,, , I />( A )]‘ C ><1 的 r , 存在某个 C = C ( r , A ), 使得 || CA " A)™-L || , 
< x >™ 对所有 M = l , 2, …成立. 

证明：论断 U ), ( b ) 和 fc } 可宵接从假定 （1), (2) 和 （3) 推出； 注意 C 3) 推出， - t 和. V 都是 
非零向量.沦断 ( d ) 可以由 （ b ) 和 （ c > 推出.命题可以用 （ b ) 和 （ c ) 来归纳证明.如果 "关 0是 
A — AL 的特征值，乂如果对某个有 （A — 则 U /1— 比)加=01^=0 = 〆 ^；,因 
而 Lu ^ O . 因此 ， （A — 所以 y 也是 A 的特征值， （ f ) 得证. 

如果 现在引 用假设 (1)11 取; / = t : 述论证说明，如果 w 是 A — AL 的特征向 M , 则 w 也 

是 A 的 A 的特征向量.根据假设〔5),我们一定可 得出加 対某个成立.另一方面， 
^- Au ' = <A ~ XL ) w = ( A - XL ) a x = a U - k a ^-^ 0, 又因为; I / O 且 w ^ O , 所以这是不可能的. 
这个矛盾证明了 （ g >. W 为 （ f ), 我们知道，或者对 .4 的某个特征值 A * 有 〆 A -； IL )= I , 

或者 P ( A — AL ) = 0. 因为已给出丫 A 的特征值的递增顺序 ， li I A „ I - I A I = P iA ), 所以由 
可知，在这两种情形， p ( A - AL )< I A „., I • 因此 ( h ) 中的不等式可直接由 （7) 推出.把 ( h ) 
和 ( e ) 结合起来不难算出，当时 (厂 1 A . Lr^(k ' Ar ~ L -* 0 , 这是 W 为 〆 A M L } = 
p ( A - XL )/ piA )^ S A „ , '>(.4 X 1. ( j ) 中的收敛速度是推论 （5. 6. 13> 应用十矩阵 A — iA-a 

的直接推论，其屮选取 e 适合 〆 A U „ , I />( A 1] + E < r < l . 口 

练习给出引理中 （ a >, ( b ) 和 （ c ~) 的证明细节. 

8.2.8 定理设 AeAt 且假定 A >0 .则 

lim ^ LA ) J A ]™ — L , 

其中， L^ xy T , As-^p(A)x, A r y=p(A)y, . r >0, ^>0 a ^'y = 1. 

证明： 引理的假定 （1)—(7) 为 A = p ( A > 所满足， x 是八的 Perron 向 M ， 且、， 
其巾 s 是 A T 的 Perron 向量.结论呵由 （ i ) 推出. □ 

8.2.9 推论如果 A 6 JV 1 [ IA >0, 则 Lsliml ^ A ) 丄 A ]™ 是秩1的正矩阵. 

8.2.10 定理如果 A 6 M ,, 且 A > U . 则 〆 是代数重数为1的特征值；即 〆 A ) 是特征方程 
九 （ f )=0 的单根. 

证明： 根据3吐『=角化定理(2.3.1)，可以记 A = [ MU *, 其中， U 是两矩阵，4是主对 
角元为……，屮 Ln ， …，夂的上三角矩阵，是代数重数的特征值；对所有 


_ 
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_ 特征值的模都严格小于〆 /n, 另一方面， 

L= lim[jO(A) M] w 


= U lim 


IT 

P 


IT ， 


其中，在后两个表系屮对角元 1 重复 A 次，在最后一个表求式中对角0元重复《 — 4次.因为 
最后表示式中的上三角矩阵至少有秩 h 乂因为 L 有秩1，得知， 4>1 是不可能的. □ 

我们现在总结一下在本节中得到的关于正矩阵的基本结果. 


8. 2.11 Perron 定理如果 且 A>0, 贝！ 

(a> p ( A » 0 } 

(b) ^A) 是 A 的特 征值； 

(c) 存在 适合 ~r>0 且 ; 

( d ) p ( A) 是 4 的代数(因而几何)单重特 征值； 

(e) U I <>(A) 对每个特征值 A 关〆 A) 成立，即〆 A> 是唯一的最大模特 征值； 

(f) 当》1~*03时[〆^) ' AJ ^ L , 其中 Aj = p ( A ) jt , A T y = pCA ) y , x > 0 , y >0 

且 ^',>< = 1. 

Perron 定理有许多应用.一个优美 |fl] 乂有效的应用是，利用占优非负矩阵的谱半径和主 
_ 对角元得到了矩阵 A 的特征值包含区域. 

8.2.12 定理（樊畿）设，且假定 B = 有非负元和 | A | . 则 A 的 

每个特征值位于区域 

Q {z 6 C ： | ^― a ,； — b n } 

j -1 

中. 

证明：可以假定 B>0, 因为如果 B 的某个元是零，我们可以考虑坟三 [\+ e ]， 其中 e > 
0; B t > \ A \ , 且当时〆 B,) —+e)—A u , 根据 Perron 定理，存在正向董 x 使 
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得因而对所有 i=U 2,…， rt 有 

2 | a ti | j ：, < S’ ， '〆; = p(B)x r — b a x f . 

)- 1 ；- 1 

因此，对所有 i = l , 2, …， n 有 

丄 i ] U „. I ^ < P CB ) - 6 „, 

丁 ，.广 , 

在推论 ( e . i . 6) 中取 a =_> :,便推出要求的结果. n 

(8. 2. 11) 中的<〖)保证确定的极限存在，而 (8. 2. 7>中的 ( j ) 给出了关于收敛速度的一个上界 

II - L [ j ,„ < C ： r , 

这个上界对某个与 A 和 r 有关的正常数 C 和任何适合 


的 r 成立，其中‘^是 A 的有第二大模的特征值.即使 〆 A ) 已知或容易估计，但是要想得出 
关于比值 I A „_, | / P C 4) 的有用界，计算或估计 | A „- ，丨 也许不方便或者不可能.在这种情形， 
知道一个容易计算的界可能很有用，这个界属于 E . Hopf , 它对任何正矩阵 A 心] 6 M „ 都 
成立： 


I A„--i I ^ M — u . 

十户又 1 ， 

其中 : “ j = l , 2, , ”} 而户=11^11{«": i , j ~ l , 2, m }. 

习蓮 

1. 如果 A >0, i 是 A 的 Perron 向置，乂如果 z 是 A T 的 Perron 向量，证明 / z >0. 

2 -如果 aeM , 是具有*个非零主对角元的上三角矩阵，证明 ran kA >^. 用例子说明，在 
这些条件下，有可能秩大于务+ 


3. 把本节推导出的结果应用于矩阵 

A= [V 〗—;]，。〈"，…， 

且与 ( 8 . 0 ) 节中的相关结论相比较. 

4如 (8. fO 节中所描述的那样，考虑具有 n >2 个城市的一般城市间的人 O 流动模型.如 
果所有人口流动系数％是正的，那么，当 7 H — «时，人0分布 〆 的渐近变化过程是什么？ 

5. 如果4>0,详细描述当 oc 时 A " 的渐近变化过程.提示：存在-种情形： A ™-0, 
A " 发散和收敛于正矩阵.说明并分析每种情形. 

6 - 在推论 (6.1. 8) 下面有一个讨论 2 X 2 正矩阵的练习试用定理 (8. 2. 2) 下面的练习讨论这 
个例子 .■ 

7 ‘ 设力 ， Ef JW „ ,且假定 A > S >0. 试且 〆 iJ ) 的 “min max ” 特征证明擓 
示：设 x 是 A 的适合的 Perron 向童. 

8 - 如果 A>0, E 是 A 的 Perron 向量，证明 


_ 
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p(A) 2 W 

j ，_?_= i 

由定义可知， a + … + a = i . 

9 . 如、果正矩阵是非奇异的，证明其逆矩阵可能不是非负的 . 如果非负矩阵 A 是非奇异的， 
证明，仅当 A 的每一列中恰好有 -• 个非零元时 . 其逆矩阵才可以是非负的.这样的矩阵与置 
换矩阵有何关系？ 

10 . 试给出定理 ( 8 . 2 . 10 ) 的下述另一个证明的细节：如果有代数重数 A > 1 . 又如 
果 . y 和I分别是 A 的左和右 Pemm 向量，则存在非零向量 jt 使得 — pJU . 另一方面， 
y 1 x = y 1 ( A - pl)z = 0 T z = 0 < 因为 /. t > 0 , 所以这是不可能的 . 提示：因为 P 的几何重数是 1 , 

[ 5021 所以 A — 〆的 Jordan 形一定恰好有一个幂零子块，它至少应该是二阶 . 证明秩为（一 1 ( 纟 > 1 > 
的任一幂零矩阵有以下性质：如果对某个有 1 ^ = 0 , 则存在某个 vec* 使得 
Bv — u . 

进一 步阅读集中论述各种界 ( 其中包括本节最后一段提到的 Ho P f 界）以及有关这方面的 
众多文献，可参看 U . Rothblum find C . Tan , “Upper Bounds on the Maximum Modulus of 
Subdominant Eigenvalues Df Nonnegative Matrices ," J.inedr Algebra Appl . 66 ( 1985 ), 45 - 86 . 
也可参看 [Kel]chapter II . theorem 2. 

8.3 非负矩阵 

因为在实际中常常遇到不是正矩阵的非负矩阵，为此，需要考虑把上一节中所论述的理论 
推广到矩阵的元素不都是严格正的情形 . 我们可能希望_，这种推广可通过取适当的极限来完 
成，这对于某些结果是可以办 到的 . 但是，令人失望的是，像秩与维数这样一些董不是连续函 
数，所以极限论证只是部分有效 . 在 Perron 定理中可以通过取极限作推广的仅有结果包括在 
下面的定理中 . 

8 . 3 .1 定理如果 /\ 6 从，且则 〆 4 } 是為的特征值，且存在非负向量 /> 0 , 』关 0 , 
使得 

证明： 对任意 e > 0 , 定义 AU ) 三 [«,, t e ]> 0 . 用表示 A ( s ) 的 Perron 向量，所以 

』 ( e )> 0 且 = 1 . 因为向量集 e > 0 } 包含在紧集 U : mCL } 中，所 

；=1 

以存在单调递减序列 e ? ， … 且 finet 二 0 ，使得 jim /( e ， > = 了存在 . 因为对所有 々二 〗， 2 , 
…有所以一定有又 

k *‘* 

- =i 卜 .f] 

所以 JT = 0 是不可能的 . 根据定理 ( S . 1 . 18 ), — 对所有 4 = 1 ， 

2 ,… 成立，所以实数序列是单调递减序列 . 因此， | 0 = 1 ^ 10 ( 4 (£*)) 存在且 10 
> P ( A )‘ m 是由事实 一 ’ 


Ar= Jim = !im 〆 AUt))_r(£ t ) 
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= lim p ( A (.€ t )) ) = pi 

和事实 i 关 C , 推出 p 是 A 的特征值.另一方面，因此一定有 □ 
关于谱半径的变分特征部分 (8. 1. 31) 可以推广到一般非负矩阵和非负 向量， 不过其证明是 
颇不相同的. 

8.3.2 定理设 A 6 M ,,， A ^ O , jce . C , 了>0且 _ r #0. 如果对某个 a eit ， Aj ^ a x , 则 〆 A ) 
^a. 

证明： iA = U „]， 设£>0,且定义 A ( e ) 三 [ u „+ e ]. 干是 A ( e )>0, 所以有正的左 
Pemm 向量 _ yU ); 即 〆 dMCe ) = 〆 ^⑺） 〆 e ) r . 已知 A.r — «々0,所以 AUh —< w > A r — 
trx >0， 因而; y ( e > 7 TAU ) j — oj ] = [ p < A ( e )) — dhUVxX ). 因为 〆 €)^>0，对所有 £>0, 
有 〆 A ( e ))- a >0. 仴当 e -0 时 〆 yUe ))— 〆 ^), 所以 〆 A )> a . 口 

8.3.3 推论如果 AeR , 且 A >0, 贝 Ij 

1 " 

( 0 ( A ) = max min — 

^ 、卞 JTip\ * 1 

证明： 如果 A >0, 且 J 关 0, 乂如果选取 

则根据定理 ( 8 . 3 . 幻， Aj '^ ou ， 因而 oSpCAl . 但是如果选取为由定理 （8. 3. 1> 保证其存在 
的特征向量，那么我们看到这个上界可以用来达到. □ 

练习考虑4=匕 □和 证明，如果丄不是正向量， （8. 1.29) 的上界不一定成 

立.址明 （ 8. max” 特征一般也不成立.然而，如上述推论所证明的那样， - raaK 

min” 特征的确可以推广. 

添加一个煆设条件，可以稍微强化定理 ( 8 . 3 . 2 ) 以给出关于向量 a . 的某些信息. 

8 .3,4定理设 A £ M „， 且 A >.0， 冉假定 A 有 IH 左特征向量.如果 _ r >0, 乂如果 Aj ~ 

> p ( J \、 cc ' 则 

证明： 设； y >0 适合4、= 〆 /!)：^且假定 . r >0 适合 _ T #0 和 A _ r — jo ( A ) j ^0. 则 
/ [Ar — 〆 A)_r] — p(A)y r j ： — — 0, 

所以一定有 Ar — fK / UxsO . □ 

不添加假设条件，不可能比定理(8.3.])更进一步把卩 6 „ 0 „定理(8.2. 11) 推广到非负 矩阵. 

当 AGM „ R ； i >0 时.非负特征值 〆 A ) 称为 A 的 Perron 根.因为相应于非负矩阵的 
Perron 根的特征向量未必是唯一确定的，所以对于一般非负矩阵（不同干力是正矩阵的情形）， 
没有关于 “ Perron 向量”的完全确定的概念.例如，非负矩阵 A = J 有每个非负向量作为相应于 
Perron 根 〆 A ) = I 的特征向量. 

习題 

1 ‘用例子说明，在 Perron 定理 (8. 2. 11) 中的不包括在定理 (8. 3 . 1 ) 中的各项命题对所有非 
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负矩阵-般不成立 ‘提示 :考虑 [“]， G "Hi J } 

2. 如果 A>0, 且对某个 yt 彡 1 有 A>0, 证明 A 有正特征向 M. 

3. 如果 A>0 有非负特征向量^其中有 r 在1个正分量和个零分 M， 证明， A 经置 
换相似可以变成形式其中 seAi，ceM r . ( „. rl , DeM n - r ； b, c 和 d 是非负矩阵， 

ilB 有正特征向量.如果「<«,证明/\ 一定是可约矩阵. 

4. 用例子说明，推论 (8. 1.30) 的下述推广不成立： a ,4^0. 如果 A 有非负特征向 量上為 

0- 1^0，则 Ajc 〆 " 丄 

5. 考虑矩阵 U 和向 fl：r=[l，2] F . 说明，如果只假定 A>0, 定理 （8.3.4) 是不 

成立的. .4 的左和右 Pemrn 向 M 是什么？ ; 

fi. 如果 A>0, 证明，存在与 .4 交换的正矩阵 fi， 当且仅当 A 有全是正的左和右特征向 
揠示： 如果I和V是 A 的正右特征向 错和正 左特征向姑，设 B = 反之，如果, r>0, 

[505] 且 Ar=p(A)/， 考虑 

7. 如果力=[«,,]€“„是非负三对角矩阵，证明 A 的所有特征值都是实的. 提示： 苜先证 
明，如果所有下和丄对角元都是正的，则可以求得正对角矩阵 D 使得是对称矩阵.然 
后证明对角线以上或以下的0元是无关紧要的. 

8. 设非负矩阵 A6M„ 是给 定的. 证明，或 #.4 是不可约的，或者存在置换矩阵 P 使得 

A| * 

P' ! AP = ■■■ ， 

V 

其中，每个 A 或者是不可约矩阵，或者是 1X1 零矩阵， i = i, k . 这种形式称为 A 的不 
可约正规形式，注意， WA) 二 [J 0 (成 ） ， H. A 的不可约正规形式未必唯一. 

j = l 

9 -矩阵 A = [%]6M,(R) 称为本性非负矩阵，是指其所有非对角元 a ,,(; 关都是非角的. 
证明，如果 A 是本性非负矩阵，则有某个 A>0 使得 Af+A>0. 试用这一论断以及 （8. 3.1) 证 
明，如果 A6M,, 是本性非负矩阵，则 A 有实特征值 r (A) (常称其为 A 的优势特征值），且有 
如下 性质：对六 的每个特征值為 rCA)>ReA,, 证明， rU) 不一定是 A 的具有最大模的特征 
值’但当 A>0 时 r (A)= p (A). 提示： Ai+A 的诸特征值为 A+A,. 

10. 定理 <8. 1. 18) 是说，若 A€Ai „ 是非负矩阵，则当也是非负矩阵时有 〆 A+B) 
这是关于谱半径的 一种单 调性结果.如果 A6M, 是丰性非负矩阵 （见 习题 9) ，证明， 
对所有对角矩阵 A+D 是本性非负矩阵.如果 A 是给定的本性非负矩阵，而 D 允 
许在实对角矩阵类中变化，则可得知，优势特征值 HA + D) 是£>的诸对角元的一个凸函数. 
进一 步阅读参看以下 文章： C , Johnson , R , Kellogg » and ' A , Stephens , “Complex 
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Eigenvalues of a Nonnegativc Matrix with a Specified Graph II Multilin. Alg, 7 (1979) t 

129 143 , 以及 C. Johnson, “Row Stochastic Matrices Similar to Doubiy Stochastic Matrices，” 

Lin. Multiluu Alg. 10 (1981), 113-130 . 可以了解 有关非 负矩阵可能具有的特征值这一重要 
论题的一些结果 . 这些文章给出一些参考文献 . 其屮包括 Dmkriev, Dynkin 和 Karpelevich 的 _ 
经典 T_ 作，以及非负逆特征值问题 . 后一个问题 ( 刻划可以是非负矩阵的谱的复数集的特征）尚 
未解决，关于另题 10 的其他信息可参看 J. Cohen, “Convexity of the Dominant Eigenvalue of 
an Esseniifilly Nonnegative Matrix,Prwc, Am^r, Math. So<\ 81 (1981) ， 657-658 , 也可参看 
(&4 ) 节 15 题 . 


8.4 不可约非负矩阵 


如果能够对不含任何0元的矩阵证明一结论，那么这个结论常常可推广到不可约矩阵，这 
是一个颇具启发性的有用法则.我们在第6章推广基本的 GerSgorin 定理时， Q 有这个法则的 
-个例证，现在要给出另一个例证.其基本思想已在定理 (6. 2. 24) 中得到证明；这里重述其相 
关的部分. 

8- 4.1 引理 设 A 6 M „， Ji 假定 A >0. 那么，是不可约矩阵，当且仅当 （J 十 Ar ^ X ). 

练习如果 AGJW „， 证明， A 是不可约的，当且仅当 A 7 是不可约的. 

目前，我们还需要 T 述简单的结果. 

8.4.2 引理 设且设，…， A „ 是 A 的特征值（计重特征值).则 A ,+ l . …， A . + 1 
是 J + A 的特征值且 〆 J + AK 1 十 〆 A \ 如果 A >0, m pd + A )= l + p ( A ). 

证明： 设代 cM ) 有重数是，则; I 是特征方程以⑴二如⑴一 A ) — 0的点重根.另外，因 
det ("— A ) = det[(f + 1 )/—CA 十 J )]， 所以 A + 1 是 (. s ') = det [ sJ — ( A + J )] = 0的是重根. 

于是 Ai +1， …， A ，+ l 是 的特征值.因此 I ( o ( I + A ) = max A , +1 | ^ max | A , | 十 1 = 

1+ P ( A ). 但是 t 当 A 5 j 0 时，根据 (8. 3.1 )， i I P ( A ) 是 J + A 的特征值，因此， "" 在这种情形， 

〆 / + A ) = i 十 / A ). □ 

练习试说明，为了证明上述引理的前一部分，下述论证为什么是不完 全的： 如果 A 是 A 
的特征值，则存在某个向 乒 0使得 Ar = h .. 但是 ， (A + nx=(A + l )^', 所以;1 + 1是 A + _ 
I 的特征值. 

8.4.3 引理 如果 A 6 M ,,， A ^ O , 且对某个有 A *>0, 则 〆 A ) 是 A 的代数单重特征值. 

证明： 如果…，4„是4的特征值，则 Af , …， M 是 A * 的特征值.由定理 (8. 3.1) 可 
知，是 A 的特征值，因此，假如 〆 ⑴是 A 的重特征值，则 〆 4^= 〆 #)是 A * 的重特征 
值.但这是不可能的， 1 M 为由定理 (8.2. ]0)可知， pCV ) 是# 的单重特征值. 

现在将可看到，在多大程度上 Pemm 定理可以推广到非负不可约矩阵.把正矩阵的 
Perrori 结果推广到非负矩阵，是与 Frobenius 的名字分不开的. 

8.4.4 定理 设 A 6 M ,, 且假定 A 是不可约非负矩阵.则 
( a ) pCA )>0 f 
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( b ) 是 a 的特 征值； 

(C) 存在正向量 1 使得 

( d > P ( A ) 是 A 的代数（因而几何>单重特征值. 

证朋： 推论 （8. L 25) 说明，即使在比不可约性更弱的条件下， （ a ) 仍然成立.根据定理 
(8.3.])，论断 ( b ) 对所有非负矩阵成立，同时它保证存在适合 = 〆 力) ^■的非负向量 _ r ^0. 
另一方而， a+Ar ^ = Ll +^^) J " 又根据引理 （8.4. 1), 矩阵 （/ + AV 1 是正的，所以 
由 （8.1.14) 可知，向横 （/ + A ) 11 —定是 IK 的.因此 + kXX 为了 

证明 （ dK 利用弓 W ( & 4 . 2) 可证，如果 〆 / H 是 A 的重特征值，则 + f + A 
的_$:特征值.但是且根据引理 （8. 4. 1), U + A )" [ >0,因此由引理 (8.1.3) 可知， 
1+/> M ) —定是 A 的单茧特征值. □ 

该定理保证，不可约非负矩阵相应于 Perron 根的特征空间是一维的.对于不可约非负矩 
_ 阵，其分量和为〗的唯一正特征向 M 称为 Peiroti 向量. 

因为不可约非负矩阵有正特征向 M , 所以 （8. 1}节末的诸结果可以应用于这类矩阵，其屮 
特别重要的是谱半径的变分特征 (8. 1.32). 另外 . 不可约，当且仅当 A 不可约，所以不可 
约非负矩阵 也有正 左特怔向量.闵此，定理 (8. 3. 4) 对不可约非负矩阵成立.这个事实在定理 
C 8.1. 18) 的下述推广中是关键的. 

8.4. S 定理设 A , B & M „. 假定 A 是不可约非负矩阵，且 4>| B ! ,则 〆 如 
果 |0( A > = p ( B )， 又是 B 的特征值，则存在 奶 ，…， A 6 R 使得 /i = (^ DA £> 1 ,其 
中 D = diag ( f ,# > , A ). 

证明： 由定理( 8 .1.1幻已经知道，如果 | B 1 ,则 〆 如果 
则存在某个使得办 = Ax , 且 U I = p ( B )= p ( A ). 因而 

P(A) I j. I — | = | B,. |<| 則 卜 |</\ U |. 

因为 A 是不可约矩阵，所以，根据定理 （8 . 3 . 4 )可知，為 | j | =p(A) | j. | . 因而 | Rr | = 

I B I U | =A U | . 此外，定理 （ S . 4. 4) 的 （ c ) 和 （ tJ ) 也蕴涵 | . r | >0，乂因为 | iJ | 

所以由 （8. 1.15) 和旧 i | r | |.r | 的事实推出 \ B \ = A . 如果定义 fteR 为 P = 

~rJ I x t I ， ^ = 1, n , 如果; lEe^C 4 )* 又如果令 ，…， 〆 ■ ) ，则 | j - | 

且; U = cVA)D I j ' I =BD I x I =Bjt. 因此 ， e ^ ir'BD \ x \ = p ( A ) I _r | =A U | . 这 
个恒等式连同 U I >0 和 I = A 的事实蕴涵 fTD ] BD = A . □ 

练习对上述证明的最后一部分，给,4{其证.明细节. 提示： 设（：=^ ' fD ' * BD , 且注意到 
A I -r I = C I j - I -~= I C I j - I IC I I I = A I j - I , 

因而在'-:角不等式中等式成立. 辐角 argU ] | 弋 | )= 常数， c ,, ^0,且 (^=£1,;. 

当4>0时，由 Perron 定理可知， 〆 泌)是為的有最大模的唯一特征值.当时，可能 
存在多个 有极大 模的特征值，不过，在这种情形， A 应该有特殊的形式，且这®特征值应该位 
十一个很规则的图形内. 

8.4.6 推论设假定力是不可约非负矩阵，义假定具有极大模特征值 〆 A ) 的集合5= 
_ { a „^ ca ), v , ，…， a „ 恰好有4个互不相同的元.则每个特征值;有代数重数1,日_ 
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S = {e^p(A)：p - 0， lr"J — l }， 

即这些极大模特征值正好是 *个 次单位根与 〆 A ) 的乘积，另外，如杲 A 是 A 的任一特征值， 
则对所有1，…，是1, P — A 是特征值. 

证明： 对于 S 中的每个特征值， fi A, p ^ e ^ p ( A ), /> = 0, 1，…，是 一 1,也就是％ = 
arg(A„-,). 假定^ >], 如果有必要，可以重新标记诸特征值，如果还有必要，也可以重新定 
义辐角使得0 =和<@<灼 <•••<>* ,<2^. 利用上述定理，且取和；得知，对 
P - 0 , 1,走一1有 A = B =D,AD。. 因 D,AD 产相似于 A, 所以它与 A 有相同的畤征 
值，因此这个恒等式说明，对任意 f = 0, 1,…，1，如果 A 的特征值集合在复平面内作角 
h 的旋转，则它仍变到 自身； （只要证明％ = 这就是上述最后一个论断，此外，已知; u 

= P (A) 是 A 的代数单重特征值（因为 A 是不可约的），所以依次令/> = 1, 2,…，*~1,便得 
iij 所有 A„. ，也是代数单重特征值. 

不过，还可以说得更详细一些.因为对每个 p = 0, 1, A — l , S = U „, A „ ,，…， 
A « 卜 {^ A „, ”…， - 所以一定存在某个产 WP ) 使得 〆 A )= A „ = AA ,; 
即对每个/>，都存在某个？ =?(/>) 使得办 = 2 tt — %「即办 = -^( m ( Kl 27 c >], 因而 ， e %( A ) eS . 
另外，如果重复定理 （8. 4.5) 给出的关于 A 的表示式，并 . LL 对于任意选定的适合 0< r , M 
<* —] 的 r , 州，取^和则得出 

A = e ,f 'DAe^D, a ADJ}D r ' = D r D„MD r D.,) *. 

因此，根据上述相同的论证.在复平面内， A 的特征值集合经&+奸的旋转变到自身.特別 
进， A / W =/ d >( A ) —定是 A 的(具有极大模的)特征值，所以对某个广 J(m ， 一 

考虑集合 砰 =0, p ,. ■，■， pm } c 「 o ，&). 上一段已提供了以下信息： ( a )06 Gi 
( b ) 如果弘， 9 J , ec , 则於 t 妁 （ mod 270 6 G ; ( c > 如果坍 6 G , 则^ ( mod 27 r )6 G . 另外显然有， 
( ( i ) 如 果炉， Pj €G, 则妁二恥+ 弘 （ modSd . 因此， G 是恰好有 A 个元素的 Abel 群；群的运 
算是“关十模为化的加法' W 为有限 Abel 群任一元素的阶一定整除群的阶，所以每个心.一定 
是/>次单位根，其中/■= 〆 ,《)是々的因子.另外，我们可以不用群的理论直接证明这一事实. 

因为对某个 j 以及每个 r 和”!有 p ,„4 -炉二扒 （ nKK ^ TO , 用归纳法可得出，（令对 
所有 r =0， 1，2， ‘..（ mod 2 ir ) 有 np , 6 G ; 即对所有 r =0, 1，2,…有 fA >6 S . 但是，假 
如不是单位根，这便蕴涵 S 有无限多个不同的元素，而这是不可能的.因此，对某个适合 
的/>， 产 =h 可假定/ ■是使 这个式子成立的最小整数.我们知道， Q 〈恥<恥《 
恥川< 2 开，且对某个固定指数 m 考虑卜，恰好可 用户十 1个点0, pi ， 2 的， …， (p-D^, 
/^=27[将区间[0， &) 分成/>个半开子区间（在右边开）； 点％ —定落在这些子区间的一个 
中_于是，存在某个适合的？使得外 <(<•/+!_; 即0<和,一因此， 
对某个一定有 〜一并 1=妗，这是因为已经证明，如果特征值，则 f 
’■^⑷和’^^⑻也是特征值-另一方面，且选定砰是最小非零辐 
角，因而一定有这就说明每个辐角 沪是釣 的某个倍数，所以必定是/即 
〜/匕因为假如则在集合 {, i ^( A >，^>( A ), …}中的不间的元素会 少于々 
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个，然而这个集合一定等于整个 S . 最后，因为每个％ 是并 =2« A 的某个倍数，又因为存在走 
个不同的 p 项和 * 个砰的不同倍数，所以对所有 m =0， 1， 2 ，…，6 — 1— 定有％ = m 沪. 

整个证明是在 4>1 的假定下进行的，但是，如果4=1，所作的论断是显然的. 口 

8- 4.7 附注如果 A >0 是不可约的，且有 i >] 个极大模特征值，则 A 的每个非零特征值位 
于中心在 C 中的0的一个圖上，这个圆恰好经过 A 的6个特征值，且使它们在整个圆上都保 
持相间的间隔.‘特別是， A 必须是 A 的非零特征值的个数的因子.因此，如果非奇 
异不可约非负矩阵，且；!是素数，则一定存在一个或《个极大模特征值；不会有其他可能性. 

8. 4.8 推论假定是不可约非负矩阵，且记 m = l , 2, .... 如果正好存 
在 A 的々>1个具有极大模的特征值，则当 m 不是 A 的整数倍时， ar =0 对所有，=1, 2, 
…， n 成立.特别是所有《,,=0. 

证明： 利用推论 ( S . 4 . 6) 选取 A 的一个极大模特征值 A = e — P ( A ), 其中 y ==27 rA . 子是， 
只要 m 不是 * 的整数倍，就不是正实数.利用定理 (8. 4. 5), 且取 B — A 和 A = P P ( A ), 得 
Hi A = e ,,f DAD ' ,所以对于 所有! _=1， …， f ! 和 m =1, 2，3， …， 有 和 uf ) 
如果， f 不是正实数，又如果《，>0,则这个等式不可能成立，因此，当^不是 A 
的倍数时，对所有:_=丨，… . —定有 □ 
练习 假定 AGA 1 是不可约非负矩阵.证明，为了保证 〆 A ) 是 A 的唯一极大模特值 ，其 
充分条件是某个〜 #(>. 但是，考察矩阵 

V 1 1- 

1 0 1 
」1 0 _ 

并说明这个条件不是必要的，你能找一个 2 X 2 矩阵的反例吗？ 

8.4.9 附注出推论 (8.4. 8>更强的结论仍成立：如果是不可约矩阵，且有个具有 
极大模的特征值，则存在置换矩阵 P 使得 

「0 a 12 0 1 


La*,i o ... o 」 

其中，丨个主对角零子块是方阵而所列出的诸子块 A,, 不一定是零矩阵.特别地，所有主对角 
元 A 必须是零 [Var, p. 28], 

为了得到在推论 (S3. 6 ) 中所播述的极大模特征值的规则图形，尽管不可约性假设是本质 
的， 但是在一般情形下不仍然可以得到某些信息. 

8, 4 ，]0 推论 如果 A£M„, A>Q r piA)>0, 如果 A 是 A 的适合丨； U =；o(A) 的特征值，则 
A/ P (A)=P 是单位根，对某个适合 = 且对 所有夕 =0, 1，2，…， k—l, 

都是 A 的特征值. 

证明： 如果 A 是不可约的，则论断可由推论 (8. 4. 6) 推出. 如果 A 可约，则 A 可经 置換相 
似变成分块上三角形式 
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* 


A z 


.0 K 

其中 A 是不可约方阵或零方阵 . A 的特征值是各对角子块矩阵 A , 
且每个次的极大模特征值集合的结构由推论 (8. 4. 8) 给出. 

练习设 


A r 的特征值的并， 
□ 




通过考察 


= K :]和 


.,4 


又 ]㈣ 


来说明，对于一般的非负矩阵 A ， A 的极大模特征值可能比 p ( A ) 以及 〆 泌）经过一个单位根的 
各次幂的旋转所得到的集合要多. 


习题 


1. 用例子说明，未列人到定理 (8. 4. 4) 中的 Perron 定理 (8. 2. 11) 中的各项命题对不可约非 
负矩阵一般不成立. 

2. 用例子说明， 10 (/十六）=1+^4)对所有46如„不成立‘试给出使这恒等式成立的关于 
A 的必要充分条件. 

3. 不可约性是非负矩阵有正特征向量的充分条件而不是必要 条件. 试考察 P ^和 

Lo 0 」 

[| °]*说明可约非负矩阵可能有或可能没有正特征向量. 

4 . 如果 A 為0是不可约的，证明，当 cc 时，矩阵 [ p (A)^A]*" 的各元一致有界. 

5. 我们已经证明，不可约矩阵有正 Perron 向量.假定 A>0, P (A)>0, j-^0, 目. 

Ar=/yi)_r; 证明，如果 j ■不是正的，则 A 是可约的.如果： r 是正的， 乂就一 定不可约吗？ 

6. 假定 A>0 是不可约的，且与 .4 可交换.如果是 A 的 Perron 向 M， 证明 &r = 

提示： 定理 (8.4.4d). 

7 - 说明多项式/一 1 = 0的友矩阵是非负矩阵有4个极大模特征值的例子.验证这些 
特征值在复平面中的位置. 

8. 设 h，h， 心是给定的正整数.说明如何构造一个非负矩阵使得它的极大模特征值正 
好是 h 个心 次单位根， h 个卜次单位拫 ，…， 以及心个 h 次单位根. 

9. 如果不可约非负矩阵 A 有々>1个极大模特征值，说明为什么称 A 为指标 A 的循 环. 

10. 如果是不可约矩阵，并且还是指标的循环，证明特征多项式以 （/) = 
P(A)*)(〆 一4) …义），其中， r , m >0 为某个整数， 外 是适合 | 户， | <〆，）的某 

些复数，；' = 2，…， m. 对 h(f) 中零和非零系数的塑式作出说明，并且基于特征多项式的形 
式给出 /i 只有一个极大模特征值的准则. 提示： 在推论(8. 4 . fi) 的证明中已知，如果^=2::/^， 
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且 A 是 A 的特怔值，则亦是 A 的特征值. r =0, I , 2, 

11. 设《>〗是素数.证明.如果 A & M ,, 是非负的，不可约的和非奇异的，则或者是 
A 的有极大模的唯一特征值，或者 A 的所有特征值有极大模. 

12. 考察力=|^ H 说明一般不可能改进推论 （ S . 4. 8>而断言， A 的所冇幂的主对角元 
一定都是零. 

】3.如果4^0,证明， A 的不可约性只与其零元的位置有系，而与非零元的大小无关. 

14. 如果 A , 则 AB 与有相同的特征值.考察〔和说明，即使 

力和 B 是非负矩阵，有可能 AB 不可约而 BA 可约.这种例子说明不可约矩阵可能相似 （甚至 
两等价）于可约矩阵；解释这是为什么.同时它说明，仅仅渉及矩阵的特征值的任何条件不能 
最终验证其不可约性. 

1「>.设是给定的不可约非负矩阵.证明，只要 BeM , ，非负 ， A + S 就不可约，并 
且只要和 B 乒0,就有 〆 A + 这是 （ 8 . 1. IS ) 到严格单调性的改进，不过需附 

加不可约性假定. 提示： （8. 1.1 SH 兑明十如果等式成立，利用(8.4.5)证明^=0. 

]6.证明可以用下述方式强化 (8.4.1). 设 AeJVtJi 非负的，且设 A 的极小多项式有次数 
m . 证明， A 不可约，当且仅当 （ H / U ™ *>0. 提示： 考虑 Z 十 A + / V 十…十 A —'+ A " •十…+ 
A " 1 , 然后用 f ， A , …， A "___ 表示 A " 1 和更高次幂. 

17. 设是给定的非负矩阵，考虑在最小二乘意义下求 A 的秩1最佳逼近问题；即 
求秩 使 || A - X|| z = min 彳 || || Z! VeAl 有秩 1}. 假定 的？^^^ 根是单 

根，如果 AA 7 或 A T A 不可约，情况就是这样.为什么？证明这样的最伟 X 是非负的，唯一的 
玷由给出，其中 r "=/ o ( AA 7 >是 A 的 Perron 根，而 w wfR " 是非负单位向量，它们分 
别是 AW 和 AM 相应于特征值 r 的单位特征向 M . 提示： 利用( 7 .4.1)中给出的秩1最佳逼近的 
特征.注意和 A T A 都是实对称半正定矩阵，所以 r , ^和加的计算原则上是不太困难的. 

18. 试用习题17求每个矩阵 

mm] 

的秩1最佳二乘逼近.证明，的秩1最佳二乘逼近不唯一 f 对于任何单位向量 
c % 是 f 的秩 1 最 佳二乘 逼近. 

8.5 素矩阵 


实际上， ft Perron 定理中可能用得最多的结果是定理 （8.2. W 巾的极限命题.定理 
( fi . 4 . 4) 的证明说明，没有把引理 (8. 2 . 7 )应用于不可约矩阵的仅有假设条件是谱半径为唯一的 

极大模特征值.因为 A == j 是有两个极大模特征值的非负不可约矩阵的例子（并且对于 
它，不存在>，所以对不可约矩阵类作进一步的限制是必要的；而最经济的办法是缺 ff 
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么就假定什么. 

8.S.tt 定义非负矩阵 AeM„ 称为素矩阵（或本原矩阵）.是指它是不可约的且只有一个极大 
模特征值. 


素性的概念厲 liFrobenius (1912). 现在.采用与定理 （ 8. 2. 8 ) 相同的证明可 fi 接由引理 
(8. 2. 7) 得到下述极限结果. 

8.5.1 定理如果 AeM„ 是非负索矩阵，则 

lim 「 jO(A) _ iA] m = L > 0. 

其中， 1 = ^' , Ax-=p(A)j-, A J y = p (A) y , j>0, ),>0 且 .t.V = 1. 另外， 如果夂，是八 的 
特征值，且对每个特征值 A^o(A) 有 U I 在 I A„ , 丨， 又如果 | | /p(A)<r<l, 则存在 

常数 C=C(r，A)， 使得 ilL^A) ]A]，" ^<0，’对所有^ = 1，2,… 成立. 口 

我们现在已经把 Perron 定理的所有结果从 IH 矩阵类推广到非负素矩阵类.但是，实际上 
仍然需要解决验证一个已知非负矩阵的素性问题，从理论上讲，可能希望不直接计算特征值就 
能做到这一点.下面的素性特征诱导出几个有用的准则，而其特征在计算上并不是有效的检 
验法. 

8.S .2 定理如果 Ae/W „ 是 f: 负的，则 A 是素矩阵，当且仅当 A ™>0 对某个成立. 

证明： 如果 A>0, 垃 A™>0， 则从 A 的有向图 r(.4) 的每个结点只到另一个结点尺一定 
存在一条长恰好为 m 的冇向道路（推论 （6.HS)). 因为这是比不可约性更强的性质，所以4 
一定不可约.像在 (S. 4 . 3) 中那样应用 Pemm 定理 （8. 2. U 山 c)， 则推出 A —定是素的.反 
之，如果 A 是素矩阵，则根据定理 （8 .S. 1 ) 有1七[ |0 ( /\) 11对某个/»会1必定有 

[ P (A) 'AJ™>0. q 

现在联想起不可约性的图解准则，上述特征连同已有的关于非负不可约矩阵的极大模特征 
值的非常强的信息给我们提供了岽性的图解准则.我们知道.正整数序列&，匕，…的最大公 
因子 (g. C . d.) 是使 i 为所有卜，心，…的闪干的最大整数 i>l. 

8.5.3 定理设 . A6M„ 是不可约非负矩阵，设表示有向图 r(A ) 的结 点集. 用 = 

松、…）表示 A A> 中起点和终点都在结点尸 （ ，=i, 2,…， n) 的所有有向道路的长度集合. 
用片 ，表示 L; 中的所有长度的最大公因子.则 A 是素矩阵，当且仅当所有 = , = 1, 2, 

n. 

证明： 我们知道，因为 A 不可约，所以其 ti 度的集合 L, 非空；对每个；和任意 j 弇 i, 在 
r(A) 中有一条连结 f； 到严的道路，同吋在 r(A) 屮也有 -- 条连结尸到尸的道路.如果 a 是 
素矩阵，则根据定理 5 . 2) ，存在某个使得 A ™>0. 因而对所有有 A *>0 ■另一 
方面，对所有!」=1， 有 m, m + 1, m + 2, ， H, 因而兄 =1 对所有, ■= 1, …， ji 
成立. 

现在假设 A 二 [« v ] 不是素矩阵‘如果 A 恰好有 纟>1 个极大模特征值，则由推论 (8. 4. 8) 可 
知，对所有/=]，…， N 以及所有不是1的倍数的 m 有〆； 11 =0. 因此 UZU， 狀， 3i， … 

因而 A 1对所有卜’ 1，… * n 成立. [―I 


函 
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8.5.4 附注比定理 (8.5.3) 中的论断稍微进一步的结论也 成立； 事实 t， 总有小=沿=〜= 
i,,， 而^个项的公共值怡好是 A 的极大模特征值的个数.这就是 Romanovsky 定理. 

卜曲的结果在许多场合是有 用的； 特别是它证明了具有止主对角元的不可约非负矩阵一定 
是素矩阵. 

8.5,5 引理 如果/是不可约非负矩阵，又如果 A 的所有主对角元都是正的，则 
A™ '>0. 

证明：如果 a = mini« M , ， …， a „„ \. 乂如果定义 

1317 B = A — diag(a n ,t£ ：2 , ■- ,u, w ) r 

则 B 是不可约非负矩阵（因为 A 是不可约的），且 = + 因而由引理 

(8.4. 1) 可知， A" [ >0. □ 

练习试说明，当对具有正对角元的非负方阵取升幂时，变成正元的任何元在所有各次幂 
中仍然是正的. 

虽然不可约矩阵的幂可能是可约的，但是素矩阵的所有幂都是素矩阵. 


8.S .6 引理设/\6 A1 是非负素矩阵.则对所有& = 1, 2 ,…，是不可约非负素矩阵. 

证明： W 为 A 的所有充分大的幂是 IH 的，所以对任意 A, 也是正的.假如对某个 h # 

是可约的，则.V的所有幂也是可约的，闶而不可能是正的.因为这与 A 的所有充分大的幂是 
正的 事实相 矛盾，所以对 A 的任何次幂都不可能是可约的. □ 

从计算 h 考虑，定理 (8. 5. 2) 中的特征本身不是验证 .素性 的有效方法，因为要计算的幂没 
有给出其上界.如果求 出川使 A’”>U, 则 A 是素矩阵；但是，如果我们还没有得到一个正幂， 
那么什么时候终止这种计算呢 y 下述定理给出的有限界回答了这个问题. 

8 . 5 . 7 定理设 AeM„ 是非负矩阵.如果/\是素矩阵，则对某个正整数*<(„一1)„"有 
A»>0. 

证明： 因为乂是不可约的，则在尸 (A) 中存在从1点兄回到结点巧的有向 道路： 这样的 
最短道路有长因此矩阵 A*| 在它的1, 1位？_("疋元，并 a 的任意幂也将有正1, ] 
元.因为 A 是素的，由引理 (8.5. H) 可知 A 卜一定不可约，闵而在 r(A*i) 中一定存在从结点 R 
回到结点/^的有向道路；这样的最短道 路冇长 因此矩阵有正 i 元和 
正2, 2元.这个过程可沿主对角线继续进行下 ifi 到得到矩阵(其中毎个夂 < n ) 为止， 
_ 这个矩阵是不可约的且有正对角元，因而由引理 (8.5. S) 可知 [A^' « _>0.因为 
1) • n*^n(n— ]) = — 1 )， 

所以证毕. 口 

如果 A 是给定的素矩阵，使 . V >0 的最小 ▲称为 A 的本原指标，通常 E 作 〆 A ). 我们已 
经看到，如果4存正对角元，则1,而在一般情形下有 7 (穴)<沪（”--1>， fi —个界 
可以得到显著改进. 

8.5.8 定理设 A6M„ 是非负素矩阵，且假定 r(A) 中的最短简单有向回路有长,、.则 

A " … 2) >0,即 y ( A)<H + .<(w —2). 
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证明： 因为 a 是不可约的，所以 r(A) 的每个结点落在一条回路上，且从任一结点回到自 
身的最短回路将是长度至多为《的简单回路.经过一个置换，可以假定，在这条最短回路中的 
结点是 P[，P” …，/V 注意到— 2)=»1+,U — 1) 且考虑 Am"-"。#-、 士 >" 乂 
把 A" 1 写成分块形式 

A- = r x " x "i, 

U ：1 x,J 

其中 X„tM s 丙为结 点尸,，…， p , 组成 r(A) 巾的一条回路，所以在每一 
行至 少有- 个非零元，因而从图 rov 0中的每个结点 p 到 r (九 ，>中的某个结点 p 〆 或许尸 
=巧）存仵某 条弧； 如果这是成立的.因为从不 ft 上述回路中的每个结点 Ph , 
…， p ,,， 到该回路中的某个结点，在 r(A) 中…定有一条长不超过^一.〃(它们是不在该回路中 
的结点数）的有向道路，所以在X:,的每一行中至少有一个非零元.当绕着回路 走了足 够多的 
附加步数时，从不在该回路中的每个结点到该回路的某个结点，显然在 r(A) 中恰好有一条长 
恰好为》 s 的有向道路. 

现在把 u'rr 1 写成如下的分块形式 


(七广 1 


Ln , 

其中， y„6M,， 而 y :2 €M„ 因为 r,， …，广组成厂 ( a ) 中的一条回路，所以在 r(Ao 中 
的每个结点&，‘••， P, 有一个圈.因为 A 是素矩阵，所以 a ■也是素矩阵，因而是不可约的. 
从 r(^v ) 的每个结点尸尸到任意其他结点，在 r ( A ') 巾有一条任至多为1的道路. 
首先绕着起点的圈走足够多次，便可以构造这样一条长恰好为„一1的道路.这说明 y u >o 和 

Yn>0. 

为 f 完成址明，算出 


_ 


A' r 




x」L』r ： ._^ XiYh X ?1 y 13 


因为在后一个表示式中的 X 子块的每一行至少含有一个非零元，乂因为在后一个表示式中的 
每个 y 子块都是正的，所以整个分块矩阵是正的， iiA- 、( A.n □ 

(8. 5. 8) 的一个推论是 H . Wiekndt 的著名结果，它给出 f 一 般的素矩阵的本原指标的准 
确上界. 


8.5.9 推论如果是非负矩阵，则 A 是素矩阵，当且仅当乂 2 ? » + z >0. 

证明： 如采 A 的任意幂是 JH 的，则 A 是素矩阵，所以，我们只要考虑逆 命题. 如果„二1, 
结论是显然的， H 此假定》>1.如果 A 是素矩阵，则 A 是不可约的，且在 rC4) 中有若干条 
回路.如果 r(A) 中最短的冋路有长„，则 rM) 中的每条回路的扶是 n 的倍数，因而由定理 
〔8 . 5. 3 )可知， A 不能是素矩阵.于是 r(A ) 中最短回路的长是或者更小，因此根据定理 
(8. 8) 有 


y ( A ) ^ w + . s {« - 2) < « + - 1 ) ( « — 2 ) = n 2 — 2 n 2 t 


□ 
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Wiclandt 给出的一个例子（木节末习题 4) 说明，界 7 (力）&« 3 — 2« 十 2是所有对角元全为0 


的矩阵的最佳界.我们知道，如果所有主对角元是正的，则 A 是素矩阵，当且仅当4" *>0. 
如果某些主对角元为 IH, 可能不是全部主对角元为 1H, 则 Holiaday 和 Varga 的 F 述结果利用 
定理 (8. 5. 8 ) 中所采用的证明思想给出 f 关于本原指标的一个羿. 


8. S. 10 定理设 AeM 是不可约非负矩阵，且假定 A 冇个正主对角元，.则 
A-" " *>0； HP 7<A)<2 h -^ 1. 

证明： 在所述假设下， -4 一定是素矩阵，曰.在厂(.4)中极小长冋路有长 i , 实际上有条 
这样的 回路. 通过置换，可以假定尸巧是 r (/ i ) 中的具有圈的结点.考虑 ] = 
A " "( A 1 )" 汉记 


.■T 



X 12 

X .； 


] 



其中， Xu , Vn ^ Mj , 而 X "，采用在定理 (8.5. S) 证明巾的相同证法来处理 A，' * 
和 ( -4')" 1 的对应位置的子块便可证明，子块&，和 X Z1 的每一行至少含有一个非零元，且子块 
Yu 和IV是 TH 的. 由定理 (8. 5. S) 中所运坩的相同推理可知，乘积 A" "A"— 1 是正矩阵. 口 


练习 


证明矩阵/ J 是素矩阵. 


它的特征值是什么？计算由 （S. r ; . 9) 和 （8. 5. 10) 给 


出的关于 y(A) 的界. y(A) 的精确值是什么？ 


作为最后一个附注.我们指出.如果想证明一个给定的非负矩阵是窠的，则可以验证该矩 
阵是不可约的且满足 Wielandt 条件 (8. 5.9). 在实际中出现的矩阵常常有特殊的结构，使我们 
容易看出相应的有向图是不是强连接的.另外，如采任一主对角元是正的，则该矩阵一定是素 
的.但是，如果矩阵很大，且没有特殊的结构或者其元素没存什么对称性，或者如果所有主对 
角儿是零.则可能需要利用定理 (8.1. 〗） 或推论 (8. G. 9 )來验 证不可 约性或素性.在这两种情形 
下，如果将所述矩阵反复 T 方若干次直到所得到的幂超过临界值(分別为„一 1或^一2„+ 2 ) 为 
止，则矩阵乘法所需要的次数将大大缩小.例如，如果 n 二10,则计算 U+AP, (/ + A) 1 , CI 
+^> 3 和 （H A) 11 ■足以验证不可约件；这是4次矩阵乘法而不是1接应用引理 （8. 4. 1) 所需要 
的8次乘法.类似的，如果/I是非负的，则计算 A : , A 1 , A 1 ". A 32 , A M *A 128 足以验证 

素件；这是 7 次矩阵乘法而不是81次乘法.注意在这些讨论屮我们未指明利用了习题 3. 

习 a 


1- 写出定理 (S. 「>. 1) 的证明. 

2. 若焱6衂„是非负素矩阵，证明射所有；，）=1，…， ji 有=〆 ^).试把这 
个结果与推论 （ 5 .S.1 彳）作一比较.可以省略掉有关素件 假设的 那二部分吗？ 

3 . 证明，如果 A^O 和 4>0, 则 A™>0 对所有成立.如果 A 是素矩阵，则对任意 
正整数 L /是素矩阵.但是，如果 -4 和 B 都是岽矩阵，则可能不是素矩阵.提示.考 

虑 [: M I} 

4. 试用 r(A> 证明， 对 Wielandt 矩阵 
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e jw „ 


是不可约素矩阵.然后证明的< 1 , 1 ) 元是零而 提示： 把 A 看成作用在标 
准基…，匕}上的线性变换.那么 A : d A "" 1 : g -? A 1 "- 11 '"- 11 ： e〆! 

5. 设 A 6 A 1 是不可约非负矩阵.证明，如果至少有一个主对角元是正的，则 A 是素矩 
阵.证明这个充分条件对 n = Z 是必要条件而对》為3则不是. 

设 A = U ,,] eAl 是非负的，且假定叫>0对某个6 = 2,…，《成立.证明/ I 的每 

个幂的 I {元 也是正的.如果叫=0而 A 2 的々，6元是正的， A 3 的 h i 元是正的吗？ 

7- 详细验证本节未提出的简便算法. 

8. 如果 A 是任意幂等矩阵，则力 = 证明，如果 A 是非负的，不可约的和幂等的， 

则 A 是秩 I 的 IK 矩阵. 


9. 给出例子说明，即使 A>0 不是素矩阵， Lim[ r (,A) 』 A]" 1 仍可能存在.实际上， A fij 
能是可约的，还可能有极大模重特征值. 

10. 证明定理 (S. 5. 1) 的 K 述部分逆命题：如果 A&M,, 是非负矩阵和不可约矩阵，乂如果 

lim [ p ( A ) 存作，则 ,4 是襄矩阵， 提示： 如果 | | =p(A ) , A ), R Az=f/z, 

0, 则[#) ' A ]' — ? 


11. 证明. 



是不坷 约的，仿 A 2 是可约的.这 -^(8.5. 6) 矛酋吗？ 


[522： 


12. 给 fil 〜个不可约非负矩阵使得 l , m [ P ( A ) Ml "' 不存在. 

13. 如果 s >0, 又如果 Ae / W „ 是非负不 fl 『约矩阵，证明 At e / 是素矩阵. 

14. 非负矩阵 A = U ,,」 称为 组合对 称的，是指\>0当且仅当…,>0对所有;_， )-1, 

«成立.证明，如果 A 是组合对称的索矩阵，则 A 2 "_ 2 >0. 提示：考虑 A 」 E 利用 （ S . 5. 和 
( S . S .10). 你能给出关于 r (,4) 的回路结构的电多的信息来改进 7 ( A ) 的界吗？ 提示： 利用 
(8. 5.8). 

1 5 . 证明，如果是非负的，不可约 的和菲 奇异的_ &»是索数，则或者 < a ) A 是索 
矩阵，或者 ( l )) A 的所有特征值有极大模且 A 相似于， p ( A )"=0 的友矩阵. 

16. —种计算非负矩阵 JeM „ 的 Perron 向±4和谱半径的方法是幕法： 


x ( ul 是任意正向量， 2， r ：'" = 1, 

y ™' 1： - Ar 1 -' 对所有 "， = 0 , ] ，2 ,…成 i ; 
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= /" H11 对所有 m 0,1,2,…成立. 

2 广 


如果 A 是素矩阵，证明，向量， 1 的序列收敛于 A 的 （右) Perron 向量，而数 $7:'^ 的序列 

1=1 

收敛于 A 的 Pemjn 根.其收敛速度如何？关于素性的假设是必要的吗？ 

17. 如果 A6JW„ 是非负的，证明 A 的素 性只与 零元的 位置有 关而与非零元的大小无关. 

18. 如果是非负的、不可约的和对称的，证明 A 是素矩阵当且仅当 A 十〆是 
非奇异矩阵.特别是，如果 A 是半正定矩阵 t 这个条件被满足.以0和1为元素的对称非负矩 
阵常常作为无向图的邻接矩阵而出现. 

19- 如果 A6M ,, 是素矩阵且证明 A ( >0. 

20. 给出定理 (8. 5. 10) 的证明细节. 

21. 计算下列各矩阵的特征值和特征向量，并且按本章的基本槪念（非负矩阵、不可约矩 



厂 0 01 

L 0 0 J- 这些矩阵为可能出现的各种可能性提供了好的实例. 


22. 在定理 (S .5.8) 的证明中，证明和 X。的每一列至少含有一个非零元.证明 y 21 


进一 步阅读关于（8, 5. 4) 中提到的 Romanovsky 定理的证明可参看 V . Romanovsky , 
“Recherches sur les Chaines de Markoff,"Ac/a Math . 66(1936), 147-251. 

8.6 —般极 限定理 

即使非负矩阵 A 是不可约的， A 的标准幕却不一定有极限，以矩阵 
「0 1 

A — 

Li 0 

为例就不难说明 这点. 尽管如此，在桉平均值计算的确切意义下，这个极限的确存在. 

8.6，1 定理 设 A 不可约非负矩阵，设九 jrtpCAh ., A r ;v : [■ 7 3 > = 1和1_ = 

o T . 则 

把 ^ = L . 

此外，存在有限正常数 C ’= C ( A ) 使得 



:〆 A)-]A]'" 


b 


对所有 N=l, 2,…成立. 
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证明： 如果令且选取 j 和/分别为 A 的左和右 Perron 向量，则引理 (8.2. 7) 的 
假定 （1) — (5) 被满足.因而矩阵 

1 - [ p ( A )-' A - L ^ - plAr ^ L ^ A )}- (A P ( A ) L )] 國 

是可逆矩阵.利用引理 (8. 2.7) 的 U ) 和本节末的习題】巾的恒等式可算出 

士 E[〆 ⑴ 

1 ^ 1 N 

+ = f-+ 古 A — L ] m 

^L + j^{p(A) 'A —UU —bUn —L ： nW-[/o(ArA —L]}_' 

= L + -^{ i o ( A )- 1 A - LM /-[^( A ) 1 A ] N + L }{ J - [/ 

在后一个表示式中与 N 有关的部分只有第二项的因子 1/ N 和项 [ P ( A 厂 1 A ]' 但是根据推论 
(8.1.33), 当 JV — m 时，矩阵各元一致有界.因此，当 N — m 时，第二项的数摄 
级为 1/ JV , 因此它一致趋于零. 口 

分析一下引理 (8. 2. 7) 和 (8. 1.23) 所需假设条件可知，相同的证法恰好证明下述更一般的 
(但叙述起来并不简短的 > 结果. 

8 . 6 .2 定理 设 A € M „ 是非负的，且设 t 和 j 是使八 3 := 1 0(糸 ) 丁和八4= 1 0(八)3 1 的非负向量. 

如果 

( a ) /5 ( A )>0； 

< b ) 

( c ) 矩阵 

I-lp(Ar t A-(^y)-^ y n 

是可逆的； 

( d ) 当 m 4 oo 时， [ pCArM ]" 『一致 有界； 

则 

“ m =(工‘ 

■ v *'" N r 1 

另外，存在有限正常数 C = C ( A )， 使得 

I 去 EWAVA ， —uw|| 

对所有 / v = l , 2 ,…成立. _ 

习麵 


1. 如果且可逆，证明 
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2扠" — B(f -f K 卜 B ) 


提示： 乘以 I-B. 

2 . 证 明定理 (8. 6. 2). 

3. 试比较定理 (8.5. 〗）和 (《.S.】） 的收敛速度.给出一 t 例 __f， 说明 （8.6. 1) 中的收敛速度 
不可能改进. 

4. 假定 A6M,, 是不可约非负矩阵，且记 A ^-[<"」，m = l, 2, 试用定理 (8. 6. 1) 证 
明，对每个给定的数对 J). >0 对 ™ 的无限多个值成立.这个结果可以看作定理 
(8.5. S) 的推广.给出一个例 -f. 说明也有历的无限多个值使得 

5. 在定理 (8. 6. 2) 的假设条件下，证明，只要数对 （/, 』)使七1式0,则对 ™ 的无限多个 
值有这个结果为什么包括习题 4. 

6. 当 A 是素矩阵时，直接证明定理 <8.5. 1) 蕴涵定理 （8.6. 1). 提示：这里所需耍的是证 
明从分析屮得来的 F 述结 果： 如果序列收敛 f 有限极限.则它 Cesarci —可和于同一极限. 

7. nmfn 


li m N 1 

再计算用定理 (8. S . l ) 给定的这个极限值，然后进行比较. 

8.7 随机矩阵和双随机矩阵 

如果非负矩阵的所有行和是 1. 则具有这一性质的矩阵称为 （行 ） 随机矩阵 ，这是 
因为每一行可以看成有„个点的样车空间上的离散概率分布.列随机矩阵是行随机矩阵的转 
置； 这样的矩阵常常出现在 (8.0) 节巾所讨论的城市间的人口流动模型中.随机矩阵还出现在 
\M Markov 链的研究中以及象经济学和运筹学这类领域的各种各样的数学模型问题中. 

A 1 中的随机矩阵的集合是紧凸集，并且具有筒单而又重要的性质.如果用表示所 
有分量为+ 1的向 M ， 非负矩阵是随机矩阵，当且仅当 = 所以，中的随机矩 
阵构成一个容易识別的非负矩阵族，它们有-个特殊的 IK 的公共特征向量.有正特征向量的 
-普:负矩阵氏有许多特殊性质[例如， （8.1.30), (8. ]. 31>和 (8. 1. 33)], 因此所有随机矩阵具有 
这些 性质. 

如杲随机矩阵的转赏也是随机矩阵，就称 .4 是 双随机矩阵；所有行和与列和 
都是 + 1. 双随机矩阵的集合也是 M ,, 中的紧 A 集’ M 然，非负矩阵 A 6 JW ,, 是双随机矩阵，当 
且仅当 /W = e 且 〆 A = 在 （ S . 3 . 5 ) 中已经遇到过.种双随机矩阵形式，即正交随机矩阵 

「]，其中 U = U ,,] CM „ 是酉矩阵.的行和与列和都是+ 1可从 (7 的行号列都是 
EmW 单位向量的事实推出. 

双随机矩阵的另一个例子是置换矩阵组成的集合(群) . 由 Birkhoff 定理可知，任一双随机 
矩阵是有限多个置换矩阵的凸组合，因而置换矩阵实际上是基本的和标准的双随机矩阵.我们 
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给出的关于 Birkhoff 定理的证明依赖干以下事实（见附录 B ) :紧凸集 S 令的每 个点是 S 的诸端 
点的凸组合.我们将证明，双随机矩阵的集合的端点恰好是置换矩阵. 

8.7.1 定理 （Birkhoff ) 矩阵是双随机矩阵，当 a 仅当对某个 Wd, 存在置换矩阵 
P] - •** 1 / J 、. 6似,，和正纯量 a ] ，…，& R ,使得 ai + …1 且 ^4 = 0】^^ 4 *..+a、.P、.. 

证明： 条件的充分件是显 然的； 我们只需证明其必要性.设 A — 是给定的双随 

机矩阵.如果 Z 是置换矩阵，则在它的每 •行 和每 •列恰 好有一个元素+1，时所冇其他元均 
为 0. 如果可以记 A = 十 a 2 C ， 其屮， 0< ai ， < 1, ai +m = l ， 且 C 是双随机矩阵， 

则因为和吧都是非零元且心、 q 是非负元，所以与 -4 的0元％=0相对应的 B 和 C 的每个 
元一定适合 0 = \= ai \ U , r v , 因而6,厂-、 =0. 由于 B 和 C 是双随机矩阵，所以它们的各 
个行和是+ 1 ,因而各非零元一定都是+ 1 , n . 与4的各非零元处在相同的位置；即二 C . 

这就证明了每个置换矩阵是双随机矩阵集合的端点. _ 

另•方面，如果4不是置换矩阵，则至少有 a 的一行，例 如第； 行，它罕少含两个非零 
元-在该行中选取任一非零元、^因为在第 E '行中至少有两个非零元且诙行中的所有 (:非 负） 

元之和是+1，所以一定适合 0<“ V : <1. 由十0<\, <:1，且第^列的所有（非零）元之 
和是十1，所以在 :所 在的同 - - 列， 一 定有另一个非 零元《, 3 、， 且.根据 
N 样的推理，在 a , ^ 所在的同一■行，労有一个廿零元 '、， ii ^ i , , II < 1 . 如果把这个 

过程继续下去，且对用这种方式依次选 ffi 的各元加上铋号，则经有限多步，原米选定的元素 
〜会 t 次冉被选到.从第一次出现元素《,,立到第二次冉出现^的过程中，诸元索组成的序列 
(包括第一次出现的 元心， 但不包括第二次出现的元化,）是 A 的元素的有限有序序列，且其中 
毎对相邻元在冋一行或 问一 列交替 出现； 设“,/是这 t 序列中的最小（正）元.设是这样 
+个矩阵，在 B 中，+〗出现在与序列的第一个相对应的位置，一 1 现在与序列的第二 
个元相对应的位置，+1出现在与序列的第兀相对应的位贾，依此类推，交替地选取 ±1. 

B 的所有其他元是 0 , 注意 ‘ 8的所有行和与列和是 0 . 设 A . =力十心. ; .石及 A . 二 A 
注意_ 与八都是非负矩阵（因为⑷ v 的极小性），且它的行和与列和是 +1( 因为 B 的行和与 
列和是0)，所以,4 + 和乃是双随机矩阵.由丁 A = jAi ++ A ，且 A — 尹4,我们得出 A 不 
是双随机矩阵集合的端点. 

刚才给出的证明说明，一个给定的矩阵是双随机染阵的紧凸集的端点.当且仅当它是置换 
矩阵.从紧凸集的每个点是诸端点的凸组合的事实可知定理成立. 口 

因为在 JW ,, 中恰好有„!个互 不相问 的置换矩阵， Birkhoff 定理保证，任意双随机矩阵 pJ 
以表示成至多 W = n ! 个 置换矩 阵的凸组合.更细致的分析说明，所需置换矩阵不超过/ V 二 V 
- 2 n + 2 - f -. 

习題 


1- 设 A 6 A 1 是非零啡负矩阵，且有 m 特征向 M . r =[_ r ,]， 乂设 D 二 diagU , ,…， a ) ,证 
明^)=^4)>0，由 （8. 1. 30) 可知且其巾 eeK " 的所有元是+ 1,由此得_ 
出， A (经具冇正主对角元的对角相似 矩阵） 相似于随机矩阵的正倍数 [即 〆 .4)]. 这个论断使我 
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们把许多有关具有正特征向量的非负矩阵的问题化简成有关随机矩阵的问题. 

2. 证明 At 中的随机矩阵的集合与双随机矩阵的集合是紧凸集. 

3. 证明 H 中随机矩阵的集合与双随机矩阵的集合各自在矩阵乘法下构成一个 半群； 即如 
果 A ， seM , 是(双）随机矩阵，则是 （双） 随机矩阵. 

4. 证明，非负矩阵是随机矩阵，当且仅当 = 

5. 证明 2 X 2 双随机矩阵是有相同主对角元的对称矩阵. 

6. U ) 试用 (8. 7. 1) 的证明中所采用的想法佴不用附录 B 的结果，给出 （8. 7. 1) 的另一个直 
接证明 t ( b ) 然后给出一个算法，把一个双随机矩阵分解为置换矩阵的一个凸组合.提示：如 
果 A 不是置换矩阵，利用证明中所表述的诸元素组成的序列作一个置换矩阵，从 A 减去这个 
置换矩阵的正数倍就得到一个有相同行和与列和的非负矩阵，且它至少有一个非零元.于是， 
在这个矩阵上重复上述过程&继续做下去. 

7. 证明 (8. 7.1) 中的分解是不唯一的. 

8. 如果双随机矩阵 A 是可约的，证明际上置换相似于形如的矩阵.关于 

LO Aj 

忒和能说些什么？ 

进一步阅读定理 (8. 7. 1) 的证明思想取肖 B . Saunders and H . Schneider , Applications 
of the Gordon-Stiemke Theorem in Combinatorial Matrix Theory , W S/AM Rev r 21 (1979), 
528 541，从中可找到有关的事实.每个双随机矩阵 AflVt 至少是^〜2〃+2置换矩阵的一个 
凸组 合，该结果的讨论可参看 M . Marcus and R . Rt ' e， w Diagonals of Doubly Stochastic 
|529| Matrices ， Math Ox ford , Ser , 2 , 10(1^59), 295-302. 




附录 A 复 数 


-个 复数有形式 


z — a -\- ib ^ 

其中 t a 和6是实数，而；是满足关系广=一1的形式符吁.实数《称为^的实部， e 作 
实数6称为 z 的虚部 * 记作 Im 二复数 2 = (i + ;6 的复共扼孑是5 =ri — 沾.如果 £,=(),+ 办和 
z 2 = Ui + t b z 是复数，则其加法和乘法的二元运算通过实数的相应运算0然定义为如下形式： 

2 Ti +■ = (hi -h a；) + z'C6, + 6 2 ) , z 2 = «i a ； — b, b 2 + i(a, b 2 t- a^b ,). 

因此，加法是实部和虚部分别相加的结果，而乘法是代数展开及关系 f = _ l 的结果 . z = U 十 
沾的加法逆是 一==—« + /(—«. 而当 Z 尹0 = 0 + /0时， z 的乘法逆是 

丄 — a — ib — u . . / ~ b \ 

7 = J T T ^ = r2 w^b 2 y 

复数 A 和& 的减法和除法定义为 

Z, — Z 2 = Z! ■) (- g,), : 丄 =;; ■( 丄 )= 

«： \ c ? ' z - a -> 

所有复数的集合记作 C ; 加法和乘法运算是可交换的，并且 C 在这些运算 F 构成一个域，以实_ 
数0 = 0十/0为加法单位元，以实数1 = 1 + ,0为乘法单位元.实数域 R 构成 C 的一个子域； Z 
的绝对值(或模）， 记作卜 I ,定义为 I H = + (^-) 13 ,它总是一个非负实数.如果 Q 关0, 

则商为 （V I A I : )A s 2 . 容易验证.乘法运算与复共轭是可交换的，^=1 且 
复共轭的复共轭又是原来的复数.因为 Re z =(】/2 )(z + ； r ) 和 Im z ), 所以实数 

就是使 Im sr = 0 的那样--些 z ^ C , 或等价地有 s = s ( = Re z ). 

几何上，复数域 C 可以看作一个具有原点 0 , —条“实轴”和一条“虚轴”的平面.因此. 
e = “ + A 可等同于有序偶 U , 实轴 Im z —0} 就是通常的实线，而虚轴 U : R ez = 0 } 就 
是实线的 i 倍或所有“纯虚”数. z 6 C 到实轴（虚轴）的投影是 Re S ). 复共轭是经实轴的 

反射.且丨 sr I 是复平面中原点到 z 的 Euclid 距离. C 的开（闭）右半平面是 UeC : Re z >^) 

0}. 而 C 的开（闭）上半平面是 kec : lm C 的单位圆盘垦 U & c : 丨^|<1丨，而 

以 r 为半径，以《6(：为中心的圆盘是 uec : I ! ^ r (. 

上一段用直角坐标描述了复平面 C . 同时复平面也可以有效地用极变标来描述，在 
平面的位置由 r 和3所确定，其中 r ■是 Z 所在的以原点为屮心的阒的半径，而0是按反时针方 
向从实线正向转到=所在的从原点出发的有向射线的角度.于是 s 的极坐标为 Cr , 的，并且通 
常用记号来表示，其中 〆 l = cod +; s i n ft 因此，如果*— “ + A 为莨角坐标，且 z = r〆 
为极坐标，则从极坐标到直角坐标的变换是 


a = rcosdf b = rfiinf?, 
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而从直角坐标到极坐标的变换（当时）是 

r = \ z \-( a 4 ^ rb z ) y K 6 - arc sin - - ar R 

r 

这里，我们一般取岡形对象常常容易用极坐标来描述.例如， C 中的单位圆盘是 
画 (r^ : 0«1, 0<3<2 jt). 



附录 B 凸集和凸函数 


设 V 是含有实数的一个域上的向童空间. V 的一组选定的元素％，…，146 V 的一个凸组 
合是其系数非负且和为1的线性 组合： 

k 

a ； -f - 十 ; a" .*■ ， cti. ^ 0 » , 

>=i 

V 的子集 K 称为凸集，是指从 K 中任意选定一组元素所作成的任一凸组合仍在 K 中.等价 
地， K 是凸集，是指 K 中各个点偶的所有凸组合仍在 K 中.几何上，这可以解释为连结 K 的 
任意两点的线段必定在 K 中； 即 K 没有“凹”或“洞”.一个凸集 K 称为凸锥， 进指毎 当 0 >0 
和就有 a _ reK (等价地， K 中元素的正线性组合仍在 K 屮）.直接验证可知，两个凸集 
(相应地，凸锥）的集和及交仍为一个凸集(相应地，凸锥). 

一个闭凸集 K 的一个端点是这样一个点 ze / f , 它只能用一种平凡的方式写成 K 中点的一 
个凸组合，也就是说， z = a . x +(\- a ) y , 0< a < l , y ^ K , 蕴涵 : t = 一个闭凸集可 

能有冇限个端点（例如 t •个 多面体），也可能有无限多个端点（例如，一个闭圆盘），还可能无 
端点（例如，圮中的闭上半平面).然面，一个紧凸集总有端点. V 中点的一个集合 S 的凸包， 
记作 Co ( S ), 就是选择 S 的所有点组作成的所有凸组合的集合.或等价地，它是包含 S 的（所 
有凸集的交)最小凸集. Kreiii - Milman 定理是说，一个紧凸集是它的端点的凸包，我们说一个 
紧凸集是有限生成的，是指它有有限多个端点，这些端点称为该凸集的生成无. 

现在假定 V 是具有一个给定范数的实或复向量空间，分离超平面定理是说，对于两个不 
相交的凸集存在 V 中的一个超平面使得 K , 位于由 H 确定的两个闭半 
空间中的一个内，而^位于另一 个内； 即 H 分离心和心 .V 中的一个超平面 H 正好是 V 
的一个一维 f 空间的正交补的一个平移： H ={.^ ev ： q )= o ), 其中，是给定的 

向量， q ^ O . 超平面"确定两个开半空间： H ' = UGV ： < T ~ p , q )>0}, FT = UeV : U 
— P , ?><0}. 集合 UH 和 =H UH 是由 F / 所确定的两个闭半空间.因此，分 
离意味着对某两个向暈 h 和对两个凸集附加某些条件就会有各种强 

化的分离结论.例如，如果 K , 和的闭包不相交，那么分离可以取得更为精确，即 
H 1 ， Kd 仟一有界集 SCV •的凸包的闭包可以通过取包含 S 的所有闭半空间的交面 
得到. 

在 V 屋具有 复内积 （•，.> 的向 量空问 C " 的情形，也可以类似地定义超平面和半空间， 
只是必须把 C " 和 R 5 ■等同起来，且必须用下述实内积 Re ( ，， . )代替 (，， . >. 将^+ ;>1& (：" 

等同于还应注意到，根据复内积的共轭线性性质， ReUi + w ,， 心十 ; 乂）二 '(+. 

+ 于是 (. n ， 勾> + (%，是匕 1 ]和 U 的（实）内积，而且中定义的超平 

面和卡空间在 c ~ 中有相应的儿何解释. 





378 附录 B 

我们说定义在一个凸集 K £ ZV 上的实值函数/是凸函數，指的是对所有 0< a < l 和所有 

x t y ^ K . 3>尹丄，有 

fiajc + ( 1 — a)jy) < af(jc) + ( 1 — a) ( * ) 

如果上述不等式总是严格的，那么/称为严格凸函數.如果对所有 0< a <] 和所有1， yeK . 
y ^', t 述不等式是反向的，那么/称为 M 函数（或严格凹函教，如果反问不等式总是严格 
的).等价地，一个凹函数(相应地，严格凹函数）正是一个凸函数（相应地，严格凸函数）的负 
值.儿何上，连结任意两个函数值的弦位于-个凸函数（相应地，凹阑数 〗 的图象的上方（相应 
地，下方）.一个线性函数既是凸的，也是凹的.在 V = R " 和 K 是开集的情形， Hessian 矩 
[5341 阵为 

Hu> ^ [^£； u) ] t 

它是 JW „( R ) 中的对称矩阵，对于一个凸函数/, 在 K 屮几乎处处存在，并且在使 H (: T ) 

存在的 K 中的各个点，它一定是半正定的.在严格凸的情形，它是正定的.反过来， 一 f 函 
数，如果它的 Hessian 矩阵在整个凸集上是半正定（相应地，正定）的，那么该函数是凸（相应 
地，严格凸）的.类似地.负定性对应凹性. 

凸函数和凹函数的最优化有一些好的性质.在紧凸集上1凸函数(相应地，凹函数）的极大 
值(相应地，极小值)在一个端点达到.另一方面，在一个凸集上，由那些达到一个凸函数（相 
应地，凹函数）的极小值(相应地，极大值）的点组成的集合是凸的， ff 且任一局部极小值(相应 
地，极大值） 是全勛 极小值(相应地，极大值）.例如，一个严格凸函数至多在凸集的一个点达 
到极小值.且一个临界点一定是极小值点. 

实数的凸组合满足某些简单而乂常用的不等式.如果^，…，&是给定的实数，那么 

k 

min ^ 〉jCM (: max*r, 

丨 、-、* fri k- 、* 

对任意凸组合 A ， m ，…，的>0和 cri 十… +〜一1 成立. 

研究定义在一个区叫上的某些简单的单变量凸函数 /(_) 可诱导出各种各样的经典不等式. 
我们可以用归纳法证明，定义 A 区间上的关十两个点的不等式 （x ) 可以推出关十《个点的+ 
等式 


YjCtJijr,), n = 2 , 3 ^--, (") 

J = 1 r I 

只要 《,>0, ai + …十 《 n = l , 且所有 x , 都在 MW 内. 

应用 （**) 于 K 间 （0. «>) 上的严格凸函数 /(d = —] og _ r , 便导出加权算术一几何平均值 
不等式 

I - 1 1 -1 

当所有 A = i / n 时，它就是算术一儿何平均值不等式 

+ 2 丄 ， > (11^)'™- ^>0, 

^ r-l r--l 
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等式成立，当且仅当所有1都相等. 

把（ * * ) 应用于定义在区间(0，上的 /U) = Zi p>l， 便导出 Holder 不等式 

公七乂 < ( 公 (土乂 1 )' ’、 

其 中工, .， j,>0, p>l, 且1/户十 1/V=L 等式成立，当且仅当向量 [_rf] 和 [M] 相关. 如果取 
/> = </=2,我们便得到 Cauchy-Schwarz 不等式的另一种形式 

等式成立，当且仅当向量和 [：y ( ] 是相关的，我们可以从 HoWer 不等式推出 Minkowski 不 
等式 

J=1 r=I i - 1 

其中 1 ， y>0 且力 >1. 等式成立，当 tL 仅当向量 U,] 和 b,] 是相关的. 

进_步阅读关于凸集与几何的其他资料可参看 [Val]. 关于凸函数与不等式的其他资料 
可参看 [Btm」 和 [BB」. 


[535| 
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附录 C 代数基本定理 


促使人们去建立复数域 C 的一个历史动机是实系数多项式可能有非艾的复零点.例如，二 
次公式表明，方程 V—2_r+2 = 0 有根（解）（1 + 〗， 1--*}. 然而，任一实系数多项式的所有零 
点都包含在 C 中.事实上， 当圯 可能的系数域扩充到 C 时，所有复系数多项式的所有零点仍 
然包含在 C 中.因此， C 是代 数闭城 的一个 例子； 也就是，不存在以 C 为其子域的域 F, 使得 
有 …个系 数取自 C 的多项式，它的根在 F 中而 不在 C 中. 

代数基本定理是说，次数至少是1的任一复系数多项式在复数中至少有一个零点 Z [即 z 是 
方程 〆 h = 0 的一个根].运用综合除法可知，如果2是 〆 _ r ) 的零点，那么 / — 2就除杉 
/>(.!■); 即，其中， gU ) 是复系数多项式，它的次数比/ > U ) 少 1. 于是 
的诸零点是的零点及 t 
下述定理是代数基本定埋的 -- 个推论. 

定理每个次数为的复系数多项式在复数域中恰好有 n 个根（重根按重数计算). 
p (. v )^ 0 的一个根的虽数是使(了一^除尽声 U ) 的最大整数 h 即 z 作为 p ( x )= 0 的根出 
现的次“数”.如果…个根有重数 3. 那么在 〆 』 )= 0 的 m 个根中，它要累计3次.由此推出， 
_每个复系数多项式在复数域上总可以分解成线性因式的乘积. 

不过，如果实系数多项式 fU) 有某些非实复根，那么它们必*成共轭对出现，因为，如 
果 0=pU )， 则由于 

(.1 — z}(.r— z) = j：' - 2Re(«)j- +1 z \ 2 , 

由此得出，任一实多项式在实数域上可分解成线性因式和二次囚式的幂的乘积，而每个不可约 
二次因式对应_ ■•对 共轭复根. 

_ 进一 步阅读关于代数基本定理的一个初等证明可参看 [tm 





附录 D 多项式的零点对其系数的连续依赖性 

运用复分析不难证明一个重要的事实，那就是 * —个次 数为〃 >1的复系数多项式的 " 个 
零点连续地依赖于它的系数. 

对于: rec", 设 /(■!：) = [/〆-<:) ， … ， / m (.r)] T , 其中/,: C "- C , ) = 1, m . 函数/: 

( T — C ™ 在: r 连续，是指每个/,在 I 连续， ；=), m . 函数 ( T — C 在: r 点连续，是指 
对每个£>0,都存在3>0,使得只要 II y — / II <5就有 | /(. y ) — /, U ) I < e , 其中 H 是 C " 

上的向量范数. 

可以用下面的说法来直观地叙述连续依赖的 结论： 把首系数为1的》次多项式的《个系数 
(首系数]除外）与该多项的 n 个零点对应起来的闲数/: < T — C " 是连续的.可是这里有个难以 
解决的问题，不存在定义这个函数的简单 方式， 这是因为，在《个零点中间不存在定义一个顺 
序的自然方式.我们提出下面的定理，作为多项式的零点对其系数的连续依赖的一个精确 
叙述. 

定理设》>1, R 设 

pix) = a,,x'' + ! x" 1 1 ■… 十屮，].%， a„ 7 ^ 0 

是一个复系数多项式，那么，对仟给€>0,存在^>0,使得对任一适合6„弇0的多项式 

<j(i) t 1 十…十 6〆 十 |539l 

和 

max I a, — b, |< 咨， 

我们有 

rainmax | Xj — ^ r<r) |< e , 

r fr 

其中， A ,, …， A ,, 是力（: r ) 的零点，而 〜，‘‘•， 〜是按某个顺序排列的 t / U ) 的零点，且(极小） 
min 取遍1, 2,…， n 的所有排列 r . 

闺此，一个多项式的各个系数的足够小的变化只会引起任一零点的一个小的变化，这一原 
理在矩阵分析中有非常重要的意义，这是因为，矩阵的特征多项式 f A U ) 的诸系数是 A 
的各元的连续函数(实际上是多项式 ）（1. 2. 11), H 的零点是 A 的特征值.因为连续函数 
的复合是连续的， A 的各元的足够小的变化只会引起的系数的一个小的变化，而它只会 
导致特征值的一个小变化.因此，实的或复的 方阵的 特征值连续地依赖于它的各个元. 

进 一步阅 读关于 〆 .!■)和 ( /(. r ) 的各零点间之差 e 的显式界可用其系数分离6及其系数的 
大小来表 / K 的问题 可参看 L . Eisner , “On the Variation of the Spectra of Matrices，”Linear 
Algebra Appl. 47(1982), 127138. _ 






附录 E Weierstrass 定理 

设 V 是具有范数 Ml 的有限维实或复向量空间. 关于中 心为:半径为 e 的球是 
|| J - J - 1| < e }. 我们称子集^^7是 开集， 是指对每个: rtS ， 都存在一个 e 
>0,使得子集: TGV 称 闭集， 是指 T 在 V 中的补集是开集.子集 SGV 称 为有界 
的，是指存在「>0,使得 S £ B .(0). 等价地， 了是 闭的，当且仅当： T 的任一收敛序列（关于 
H ) 的极限都在了中，而 S 是有界的，是指 S 包含在具有有限半径的任一球中.子集 SQV 
是紧集，是指它既是闭的，又是有界的. 

对于 SGV ， 一个函数/: S — R 在 S 上可以达到或者不可以达到一个(全局>极大值或极小 
值.但是， 在某些 常见的情形，我们可以确信./在 S 上达到 一 个极大值. 

定理 / Weierstrass ) 设 S 是有限维实或复向董空间 V 的紧子集.如果 /: S — R 是连续函 
数，那么存在点使得对所有 ^ es 有 

< f (- r 、 ， 

且存在 点〜, ,6 5,使得对所有1£3有 

^ / 

即/在 S 上达到它的极小值和极大值.当然，可能不止在 S 的一个点上达到值=彡/0~)和^^/(1), 
_ 如果 Wd e mni SS 定理的两个主要假定（紧的 S 和连续的 /) 不成立，结论可能不真.1但是 ， S 
是一个有限维实或复向童空间的子集不是本质的.对子紧集的一个适当的定义 ， Weierstrass 
_ 定理对定义在一般拓扑空间的一个紧子集上的连续实值函数成立. 
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